我有一个数据帧pandas
看起来像如何测量熊猫群组中对象的重叠?
example_df = pd.DataFrame({"class": ["A", "A", "A", "B", "B", "B"], "id": [1,2,3,4,5,6], "value": [100, 100, 101, 101, 102, 103]})
example_df
class id value
0 A 1 100
1 A 2 100
2 A 3 101
3 B 4 101
4 B 5 102
5 B 6 103
我想知道,每个class
A或B,怎样独特的value
s为;也就是说,它与另一个类共享多少个值。 (您可以假设只有两个类。)例如,给定上面的数据框,A与B
共享一个值。
通过将列拆分为set
s并手动计算交点来完成此操作并不困难,但这不是很好。在熊猫中有没有一种优雅的方式呢?