2017-05-16 125 views
0

我有使用pd.read_csv()的Python,熊猫连接多个dataframes

目前我正在试图通过CSV列表进行迭代,并使用pd.concat()方法和轴参数设置到其中一个予加载作为数据帧的CSV文件的列表一个按列添加所有数据帧。

它正在工作,但希望我遇到的问题是,由于所有的数据帧都具有相同的colums的名字时,我串连他们,我得到例如10列所有关键“日期”

有无论如何,我可以给colums所有独特的名字例如London_Date,Berlin_Date?显然这些名字是基于数据框的名字。

+0

如果你知道如何避免列,你可以删除他们的权利 –

+0

可能的重复[选择/排除熊猫集列](http://stackoverflow.com/questions/14940743/selecting-excluding-sets-of-columns-in-pandas) –

回答

0

如果传递的密钥列表来concat(),然后你可以单独指标要与给定的键,像这样的任何列:

df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'], 
       'B': ['B0', 'B1', 'B2', 'B3'], 
       'C': ['C0', 'C1', 'C2', 'C3'], 
       'D': ['D0', 'D1', 'D2', 'D3']}, 
       index=[0, 1, 2, 3]) 
df2 = df1 
df3 = df1 
add = pd.concat([df1, df2, df3], axis = 1, keys=['Group_1', 'Group_2', 'Group_3']) 
print(add.Group_1.A) # or add.Group_2.B etc...