我有一个数据表和一个可拟合系数数据表。我想计算每行的拟合值。具有匹配列名称的R data.table点积(对于每个组)
dt = data.table(a = rep(c("x","y"), each = 5), b = rnorm(10), c = rnorm(10), d = rnorm(10))
coefs = data.table(a = c("x","y"), b = c(0, 1), d = c(2,3))
dt
# a b c d
# 1: x -0.25174915 -0.2130797 -0.67909764
# 2: x -0.35569766 0.6014930 0.35201386
# 3: x -0.31600957 0.4398968 -1.15475814
# 4: x -0.54113762 -2.3497952 0.64503654
# 5: x 0.11227873 0.0233775 -0.96891456
# 6: y 1.24077566 -1.2843439 1.98883516
# 7: y -0.23819626 0.9950835 -0.17279980
# 8: y 1.49353589 0.3067897 -0.02592004
# 9: y 0.01033722 -0.5967766 -0.28536224
#10: y 0.69882444 0.8702424 1.24131062
coefs # NB no "c" column
# a b d
#1: x 0 2
#2: y 1 3
对于DT每个a=="x"
行,我想0*b+2*d
;并且对于dt中的每个a=="y"
行,我想要1*b+3*d
。
是否有一个数据表的方式来做到这一点没有硬编码的列名?我很高兴将列名放在变量cols = colnames(coefs)[-1]
中。
很容易将组和rbind
一起循环,因此如果分组导致麻烦,请忽略该部分。
我的相似问题:http://stackoverflow.com/q/19279075/对于它的价值,我认为人们会关心动态匹配名称是很自然的事情,并且这不会使这个问题成为“移动目标“完全可以。 – Frank