2016-11-18 144 views
0

我有熊猫数据帧DF表行明智分拣大熊猫数据帧并删除重复

col1 col2  count 
12  15  3 
13  17  5 
1  36  4 
15  12  7 
36  1   4 

等等.... 我想是考虑像'12 15' 和'calues 15和12'是相同的,并且也计算它们的计数 并创建新的数据帧df2 ,其没有重复的条目和它们的计数被添加。例如 。

col1 col2  count 
12  15  10  #3+7 
13  17  5 
1  36  8  #4+4 

等。 我应该使用哪种方法来获取? 在此先感谢

回答

2

排序的列,然后组和金额:

df[['a', 'b']] = df[['a', 'b']].apply(sorted, axis=1) 
df.groupby(['a', 'b'], as_index=False)['c'].sum() 
+0

即使我改变轴到凌晨1点没有得到正确的结果 – Shubham

+0

@我也想“计数”,以显示在req – Shubham

+0

是的,我发布了一些过早。给我几分钟。 – Kartik