1
我有我需要收集总和和唯一计数统计的数据。该数据的粗略格式如下进来为CSV:熊猫 - 将键值列更改为键控行
Customer PartType 2011 2012 2013
A widget_b 1000 10000 20000
B widget_a 1 1000 5000
....
我需要能够按客户(不PartType)汇总此表并逐年做客户之和计数大小的块,如以及每年按PART_TYPE统计客户的相同练习。
几个问题:
1)是否有使用熊猫进行,看起来像一个数据帧的一个简单的方法:
Customer PartType Year value
A widget_b 2011 1000
A widget_b 2012 10000
....
我想我可以用pandas.pivot_table然而,做到这一点结果是groupby无法轻松处理的奇怪数据类型。
2)是否有一种简单的方法在客户大小桶内按年生成总和和计数?我在groupby方法中使用了pd.cut,它每次只生成一年的总和或计数,所以当您打印其他年份结果时,它们完全相同。