0
我有一个数据帧,看起来像:汇总数据
respondent_id,group_number,member_id
1,1,3
1,1,4
1,2,1
....
我的目标是输出两个计数每位受访者ID;包括他们自己作为成员ID的组的数量,以及那些不包含它们的组的数量。
例如,上表将输出:
respondent_id,my_groups,other_groups
1,1,1
我最好的猜测是做这样的事情:
rg_g = df.groupby(['respondent_id','group_number'])
rg_g.apply(lambda g: g.respondent_id in g.id.values)
但我不知道从哪里里去。
这真的很接近我在找什么。但是,我需要筛选列表,以便计算具有respondent_id的组和不支持的组。 – Jeremy