数据大熊猫组我有一个数据帧,看起来像这样:分类计数通过数据框
+---+-----------+----------------+-------+
| | uid | msg | count |
+---+-----------+----------------+-------+
| 0 | 121437681 | eis | 1 |
| 1 | 14403832 | eis | 1 |
| 2 | 190442364 | eis | 1 |
| 3 | 190102625 | eis | 1 |
| 4 | 190428772 | eis_reply | 1 |
| 5 | 190428772 | single_message | 1 |
| 6 | 190428772 | yes | 1 |
| 7 | 190104837 | eis | 1 |
| 8 | 144969454 | eis | 1 |
| 9 | 190738403 | eis | 1 |
+---+-----------+----------------+-------+
我想要做的是计算每个msg
的情况下,每一个UID。
我创建了一个GROUPBY对象,发现所有消息的计数:
grouped_test = test.groupby('uid')
grouped_test.count('msg')
但我不太清楚如何计算每个UID每种类型的消息。我正在考虑创建掩码和4个独立的数据框架,但这似乎不是一种有效的方法来实现这一点。
样本数据 - http://www.sharecsv.com/s/16573757eb123c5b15cae4edcb7296e3/sample_data.csv
请将您的样本数据以容易切入熊猫(理想情况下为CSV格式)的格式发布。 – BrenBarn
你的数据有多大? – Leb
@Leb大约10,000行,有237个分组的使用者虽然 – metersk