我有一个重复列名称的数据帧,这些数据帧会导致重复测量。熊猫数据帧中重复列的平均值
df = pd.DataFrame({'A': randn(5), 'B': randn(5)})
df2 = pd.DataFrame({'A': randn(5), 'B': randn(5)})
df3 = pd.concat([df,df2], axis=1)
df3
A B A B
0 -0.875884 -0.298203 0.877414 1.282025
1 1.605602 -0.127038 -0.286237 0.572269
2 1.349540 -0.067487 0.126440 1.063988
3 -0.142809 1.282968 0.941925 -1.593592
4 -0.630353 1.888605 -1.176436 -1.623352
我想采取的cols平均 'A' 和'B的,使得数据框缩小到
A B
0 0.000765 0.491911
1 0.659682 0.222616
2 0.737990 0.498251
3 0.399558 -0.155312
4 -0.903395 0.132627
如果我做了典型
df3['A'].mean(axis=1)
我得到一个系列(没有列名),然后我应该建立一个新的数据框与每个col组的手段。另外,.groupby()方法显然不允许按列名进行分组,而是给出列并对索引进行排序。有没有一种奇特的方式来做到这一点?
端问题:为什么
df = pd.DataFrame({'A': randn(5), 'B': randn(5), 'A': randn(5), 'B': randn(5)})
不会产生4列的数据帧,但合并同名的cols?
要回答你的身边的问题,为什么你认为定义有重复键的字典将工作? – EdChum