2015-10-28 81 views
3

我遇到了熊猫合并功能中的一个棘手问题。这里是我的问题的玩具例子:在大熊猫中合并数据框与系列的麻烦

df1 = pd.DataFrame({'A': [0, 1, 2, 3], 
        'B': ['B0', 'B1', 'B2', 'B3'], 
        'C': ['C0', 'C1', 'C2', 'C3'], 
        'D': ['D0', 'D1', 'D2', 'D3']}, 
        index=[0, 1, 2, 3]) 

s = pd.Series(['E0', 'E1', 'E2', 'E3'], index = [0,1,2,3]) 

如果我现在要离开了合并这些基于数据帧列A和该系列中的指标,即:

pd.merge(df1,s,how='left', left_on = 'A', right_index = True) 

我得到以下错误:

IndexError: list index out of range 

我真的不明白。为了使事情更混乱,与另一数据框代替系列意味着一切都工作得很好:

df2 = pd.DataFrame({'E': ['E0','E1','E2','E3'], 
        'F': ['F0', 'F1', 'F2', 'F3']}, 
        index=[0, 1, 2, 3]) 

pd.merge(df1,df2,how='left', left_on = 'A', right_index = True) 

给出:

A B C D E F 
0 0 B0 C0 D0 E0 F0 
1 1 B1 C1 D1 E1 F1 
2 2 B2 C2 D2 E2 F2 
3 3 B3 C3 D3 E3 F3 

我可能失去了一些东西很基本的,但我怀疑这是一个那些有助于了解未来的事情!

非常感谢提前。

+1

你需要使用'merge'您可以通过给定系列,s名称控制该列的名字吗?您可以分配一系列例如'df1 ['E'] = s' – AChampion

回答

3

pd.merge需要DataFrames作为其前两个参数。第二个参数不能是一个Series。但是,你可以使用它的方法to_frame转换s到框架:

In [10]: pd.merge(df1, s.to_frame(), how='left', left_on='A', right_index=True) 
Out[10]: 
    A B C D 0 
0 0 B0 C0 D0 E0 
1 1 B1 C1 D1 E1 
2 2 B2 C2 D2 E2 
3 3 B3 C3 D3 E3 

注意,最后一栏的名字是0

In [15]: s.name = 'Foo' 

然后最后一栏的名字变成Foo

In [17]: pd.merge(df1, s.to_frame(), how='left', left_on='A', right_index=True) 
Out[17]: 
    A B C D Foo 
0 0 B0 C0 D0 E0 
1 1 B1 C1 D1 E1 
2 2 B2 C2 D2 E2 
3 3 B3 C3 D3 E3 
+0

没有意识到合并需要2个数据帧。非常感谢! –