1
我有以下两个数据帧:df1和df2。 对于每个用户,我想删除包含未出现在df2中的itemid的行。熊猫 - 给定两个数据帧,删除差异
df1
userid itemid
1 1
1 3
1 4
2 1
2 2
2 3
2 4
df2
userid itemid
1 1
1 2
1 3
1 4
2 1
2 2
2 3
由于用户ID = 1在DF1已itemids在DF2 1,3,4和用户ID = 1具有itemids 1,2,3,4,我不必从DF1除去任何行。但是,对于userid = 2,df1具有项目ID 2,3,4,而df2具有项目ID 1,2,3。在这种情况下,我想删除最后一行,因为itemid = 4不在df2中。 因此,答案应该是以下几点:
new_df1
userid itemid
1 1
1 3
1 4
2 1
2 2
2 3
请注意,DF2不应该改变。我只想要df1改变。