2017-08-02 88 views
1

如果我有2个数据有一些相同的列名,我想检查不同的观测值,我该怎么办?两个数据重复测试

这里是我的样本数据:

# dt1 
ID Name ColA ColB 
2 Peter 1  2 
4 Freda 50  4 
5 Jean 8  10 

# dt2 
ID Name ColA ColB ColC ColD 
1 Roger 1  2  400 
2 Peter 1  2  500 2000 
3 Tina 3  50   20 
4 Freda 50  4  500 300 
5 Jean 8  10 89  54 

ColAColBColCColD是不重要的。我只想检查IDName

二,检查dt2哪一行与dt1不一样。
因此,其结果是:

ID Name ColA ColB ColC ColD 
1 Roger 1  2  400 
3 Tina 3  50   20 

因为我的真实数据是非常大的,我该怎么检查?

+2

你只是想通过ID和名称反连接?如果是这样,请参阅[this](https://stackoverflow.com/questions/28702960/find-complement-of-a-data-frame-anti-join) –

回答

3
> library(dplyr) 
> anti_join(dt2,dt1,by=c('ID','Name'))