2017-07-07 48 views
0

我有数据帧是这样的:如何聚集的一些数据在数据帧的大熊猫

df = pd.DataFrame({'id': [115,120,200], 'category': ['a','a', 'b'], 'clust': [1, 2, 3]}) 

我想要聚合和计数每一个类别,这是特别clust的ID的数量。例如,结果可以还数据帧,其中索引行是clust和索引列是类别和值的id的量

回答

0

IIUC,让我们使用groupbyunstack

import pandas as pd 
df = pd.DataFrame({'id': [115,120,200], 'category': ['a', 'a', 'b'], 'clust': [1, 2, 3]}) 
df 

输入数据帧:

category clust id 
0  a  1 115 
1  a  2 120 
2  b  3 200 

集团,aggegrate重塑:

df_out = df.groupby(['clust','category'])['id'].count().unstack() 

输出:

category a b 
clust    
1   1.0 NaN 
2   1.0 NaN 
3   NaN 1.0