1
让我们说我有这样的结果熊猫:GROUP BY和排序总规模
group1 = df.groupby(['first_column', 'second_column'], as_index=False).size()
first_column second_column
A A1 1
A2 2
B B1 1
B2 2
B3 3
然后,我希望它计算总大小FIRST_COLUMN并显示弄成这个样子
first_column second_column
A A1 1 3
A2 2
B B1 1 6
B2 2
B3 3
并根据总尺寸,我希望它被排序成前10位的最大总尺寸。我该如何做这样的事情?也有可能给列的名称。像这样
first_column second_column size total_size
更新1
数据帧应该是这样的。
df.head()
first_column second_column
0 A A1
1 A A2
2 A A2
3 B B1
4 B B2
5 B B2
6 B B3
7 B B3
8 B B3
你能告诉你的DF? –
@AntonProtopopov请参阅更新1 – Mrye