0
A
回答
1
使用groupby
和transform
通过value_counts
。
df[df.Agent.groupby(df.Agent).transform('value_counts') > 1]
注意,即,为mentioned here,你可能有一个代理与同一客户多次交互。这可能被保留为误报。如果你不希望这样,您可以过滤前添加drop_duplicates
电话:
df = df.drop_duplicates()
df = df[df.Agent.groupby(df.Agent).transform('value_counts') > 1]
print(df)
A B
0 1 2
1 2 5
2 3 1
3 4 1
4 5 5
5 6 1
mask = df.B.groupby(df.B).transform('value_counts') > 1
print(mask)
0 False
1 True
2 True
3 True
4 True
5 True
Name: B, dtype: bool
df = df[mask]
print(df)
A B
1 2 5
2 3 1
3 4 1
4 5 5
5 6 1
+0
OP没有提到它,但可能想要迎合与单个代理反复进行交互的情况,该代理目前将被考虑(可能不正确)。 。在分组之前可能要抛出'.drop_duplicates()'... –
+0
@JonClements当然,听起来很合理。已添加。 –
相关问题
- 1. 在熊猫数据框中重复行
- 2. 熊猫数据帧上重复的行
- 3. 为熊猫数据框添加行同时保留类型
- 4. 如何乘大熊猫数据框并保留行键
- 5. 如何删除熊猫数据框中的特定重复行?
- 6. 熊猫数据帧..重复取样行
- 7. 熊猫到Excel:保留现有数据
- 8. 在Python中保留列顺序熊猫数据框
- 9. 将熊猫系列添加到数据框中,保留索引
- 10. 删除重复项,同时保留熊猫中的NaN
- 11. 将熊猫数据框转换为numpy数组,保留索引
- 12. 从熊猫数据框中删除重复,如果重复值是下一行
- 13. 如何在熊猫数据框中保留每个组的前3行?
- 14. 删除熊猫数据框中的行
- 15. 列在熊猫数据框中的行
- 16. 熊猫数据框中的动态行
- 17. 导出熊猫数据框,同时保留模式
- 18. 如何获得熊猫数据框中的行,并在列中保留最大值并保留原始索引?
- 19. 将重复计数列添加到熊猫数据框中
- 20. 熊猫数据框中的不可重复类型错误
- 21. 熊猫:数据框中的联合重复字符串
- 22. 熊猫合并保留列名的重复DataFrame列
- 23. 重置大熊猫数据框的值
- 24. 熊猫:删除重复的记录,同时保留其数据框中的旧值以供参考
- 25. 熊猫 - 重复迭代行
- 26. 在熊猫数据框中乘以行
- 27. 由熊猫数据框中
- 28. 从熊猫数据框中
- 29. 从熊猫数据框中
- 30. 从熊猫数据框中
应该通过熊猫使用组来做到这一点:https://pandas.pydata.org/pandas -docs/stable/generated/pandas.DataFrame.groupby.html –