我正在编写下面的Python代码来合并两个表格,这些表格可以在Excel中使用Vlookup完成,但希望为更大的数据集自动执行此过程。但是,看起来输出数据太大并且包含两个表中的所有列。我只是想用第二个表df_pos来查找一些列。你会看看我的代码是否有效或可行,以执行此任务?python pandas merge/vlookup tables
谢谢!
def weighted(mwa="mwa.csv",mwa2="mwa.csv",output="WeightedMWA.csv"):
df=pd.read_csv(mwa, thousands=",")
df['Keyword']=df['Keyword'].replace('+','')
df_pos=pd.read_csv("mwa.csv", thousands=",")
df_pos['Keyword']=df_pos['Keyword'].replace('+','')
sumImp=df_pos['Impr.'].sum()
sumPos=df_pos.groupby(by=['Keyword'])['Avg. Pos.'].sum()
df_pos['WeightedPos']=sumPos/sumImp
mergedDF=pd.merge(left=df, right=df_pos, how="left", left_on="Keyword",right_on="Keyword")
mergedDF.to_csv(output)
我认为这是最适合[codereview](http://codereview.stackexchange.com/)。 – shivsn
我还没有用过Stackoverflow,我会在下次做。谢谢! – prodirector