0
我有数据帧是这样的:如何聚集的一些数据在数据帧的大熊猫
df = pd.DataFrame({'id': [115,120,200], 'category': ['a','a', 'b'], 'clust': [1, 2, 3]})
我想要聚合和计数每一个类别,这是特别clust的ID的数量。例如,结果可以还数据帧,其中索引行是clust和索引列是类别和值的id的量
我有数据帧是这样的:如何聚集的一些数据在数据帧的大熊猫
df = pd.DataFrame({'id': [115,120,200], 'category': ['a','a', 'b'], 'clust': [1, 2, 3]})
我想要聚合和计数每一个类别,这是特别clust的ID的数量。例如,结果可以还数据帧,其中索引行是clust和索引列是类别和值的id的量
IIUC,让我们使用groupby
和unstack
:
import pandas as pd
df = pd.DataFrame({'id': [115,120,200], 'category': ['a', 'a', 'b'], 'clust': [1, 2, 3]})
df
输入数据帧:
category clust id
0 a 1 115
1 a 2 120
2 b 3 200
集团,aggegrate重塑:
df_out = df.groupby(['clust','category'])['id'].count().unstack()
输出:
category a b
clust
1 1.0 NaN
2 1.0 NaN
3 NaN 1.0