2017-09-22 44 views
2

我有一个表与如下数据:计数独特的元素和总结值在大熊猫GROUPBY操作

day   concept click item_id 
2015-05-01 A   6  s4P~Hzs1w5R12Dpyn2IK 
       B   6  s4P~Hzs1w5R12Dpyn2IK 
       C   1  DOwfmfFvdEIZ1IdXqTiu 
       D   1  wPaYuIh~t8y7rU3HP43N 
       D   7  Ya_M~2N6eX0kem8IgdSp 

而且我想获得distint ITEM_ID的计数和总结点击所有日常ITEM_ID,例如:

day   concept  click count_item_id  
2015-05-01 A   6  1 
       B   6  1 
       C   1  1 
       D   8  2 

我用Python和熊猫库

回答

2

使用groupby后跟agg工作:

df.groupby(['day', 'concept']).agg({'click' : 'sum', 'item_id' : 'count'}) 
Out[429]: 
        item_id click 
day  concept     
2015-05-01 A    1  6 
      B    1  6 
      C    1  1 
      D    2  8 
0

请检查,如果这是你想要什么:

df[['day', 'concept']].groupby(['click', 'item_id']).agg(['sum', 'count']) 
+0

后试图请后的代码。当没有名为'click'和'item_id'的列时,如何使用groupby – Dark