2015-06-10 23 views
2

我试图做一些事情非常简单,data.table一个表中的所有行,我失去了惯用的方式做到这一点我如何可以选择匹配另一个表

library(data.table) 
set.seed(1) 
DT = data.table(a=sample(letters,1e5,T), b=sample(letters,1e5,T), c=rnorm(1e5)) 
DT2 = data.table(a=sample(letters,5,T), b=sample(letters,5,T)) 

DT2 
    a b 
1: k h 
2: e v 
3: f n 
4: m q 
5: w v 

我想选择的行DTDT2相匹配。 因此,操作后的行数将始终小于初始表。

我想要的东西,这样做:

> DT[paste(a,b) %chin% DT2[,paste(a,b)]] 
    a b   c 
    1: m q -0.4974579 
    2: e v -0.1325602 
    3: w v -1.8081050 
    4: m q 0.9025120 
    5: w v -0.4958802 
---    
729: f n 0.5604650 
730: f n -1.2607321 
731: m q 0.5146013 
732: m q -1.8329656 
733: k h -0.9752011 
> DT2[paste(a,b) %chin% DT[,paste(a,b)]] 
    a b 
1: e v 
2: f n 
3: k h 
4: m q 
5: w v 
> 
+0

你想要第一个结果,还是第二个?或两者?如果是后者,那是不同的问题。 – BrodieG

+0

我想要这两个,或者提醒我为什么我不能得到它 – statquant

回答

3

内加入应该做的:

setkey(DT, a, b)[DT2, nomatch=0] 

产地:

 a b   c 
    1: k h -1.6592442 
    2: k h 1.1946471 
    3: k h -0.8694933 
    4: k h 0.7789158 
    5: k h -1.3142607 
---    
729: w v -0.3516787 
730: w v 0.5272145 
731: w v -0.7531717 
732: w v 0.3352228 
733: w v 0.1182353 

如果你想知道在DT2哪些值存在于DT那么:

unique(setkey(DT[, .(a, b)], a, b))[DT2, nomatch=0] 
+0

@statquant,我更新了答案,但没有关于错误的更多细节,我无法提供额外的输入。 – BrodieG

+0

实际上,如果我做'setkey(DT2,a,b)[DT]'我得到超过5行...所以这不是我更新的问题,所以它更清晰 – statquant

+0

@statquant你期望什么? 'DT'不是唯一的,所以当然你会得到超过5行。也许我错过了什么? – BrodieG

相关问题