如何聚集的一些数据在数据帧的大熊猫

df = pd.DataFrame({'id': [115,120,200], 'category': ['a','a', 'b'], 'clust': [1, 2, 3]})

我想要聚合和计数每一个类别，这是特别clust的ID的数量。例如，结果可以还数据帧，其中索引行是clust和索引列是类别和值的id的量

2017-07-07 Olga

IIUC，让我们使用groupby和unstack：

import pandas as pd 
df = pd.DataFrame({'id': [115,120,200], 'category': ['a', 'a', 'b'], 'clust': [1, 2, 3]}) 
df

输入数据帧：

category clust id 
0  a  1 115 
1  a  2 120 
2  b  3 200

集团，aggegrate重塑：

df_out = df.groupby(['clust','category'])['id'].count().unstack()

输出：

category a b 
clust    
1   1.0 NaN 
2   1.0 NaN 
3   NaN 1.0

2017-07-08 04:29:27

回答