我想按单词在熊猫数据框上进行汇总。如何在熊猫数据框中按单词分组统计
基本上有3列与点击/印象计数与相应的短语。我想将这个短语拆分为令牌,然后将它们的点击总结为令牌,以确定哪个令牌相对好/不好。
预期输入:数据帧熊猫如下
click_count impression_count text
1 10 100 pizza
2 20 200 pizza italian
3 1 1 italian cheese
预期输出:
click_count impression_count token
1 30 300 pizza // 30 = 20 + 10, 300 = 200+100
2 21 201 italian // 21 = 20 + 1
3 1 1 cheese // cheese only appeared once in italian cheese