2017-10-18 49 views
-3

我的问题非常类似于这个Subset with unique cases, based on multiple columns。唯一的区别是我不希望重复的值显示在最终的数据框中。 原始数据框中:如何摆脱数据帧列中的重复值

df 
v1 v2 v3 v4 v5 
1 7 1 A 100 98 
2 7 2 A 98 97 
3 8 1 C NA 80 
4 8 1 C 78 75 
5 8 1 C 50 62 
6 9 3 C 75 75 

使用> df[!duplicated(df[1:3]),]让我

v1 v2 v3 v4 v5 
1 7 1 A 100 98 
2 7 2 A 98 97 
3 8 1 C NA 80 
6 9 3 C 75 75 

但我想是

v1 v2 v3 v4 v5 
1 7 1 A 100 98 
2 7 2 A 98 97 

6 9 3 C 75 75 

我用独特的尝试,但现在看来,这只是保持我分析柱。任何帮助将不胜感激!

回答

1

我们还需要从另一端

df[!(duplicated(df[1:3])|duplicated(df[1:3], fromLast = TRUE)),] 
得到 duplicated