2016-02-11 42 views
2

我有一个原始调查数据df,其中7个项目来自5个人。每个人的一个项目(不是相同的项目)是比较的主题。矢量vec指示物品的位置。此外,还有两个用于比较的矩阵prob1prob2。比较的结果是,如果随机值低于prob1中相同位置的值,则原始调查响应将替换为9.如果随机值介于prob1prob2之间的值之间,则原始调查响应为用99代替。R:在多次比较后替换不同列中的元素

在下面的例子中,对于第一个应答者,项目3的响应是3,这是比较的一个主题。从prob1prob2对应的值是.103.781。因为第一个应答者的一个随机数,.482是在这两个值之间,所以第一个应答者的初始数据需要用99代替。

我当然可以使用for-loop来做,但它运行的很慢。我试图使用sapply函数,但我真的没有得到正确的解决方案。有什么建议么?谢谢!

set.seed(100) 
df<-as.data.frame(matrix(sample(c(1:4),35,replace=T),nrow=5)) 
vec<-c(3,5,2,3,1) 
set.seed(1) 
prob1<-round(matrix(runif(35,0,.5), nrow=5),3) 
set.seed(2) 
prob2<-round(matrix(runif(35,.51,1), nrow=5),3) 
ran<-c(.482, .298, .115, .163, .644) 

> df 
    V1 V2 V3 V4 V5 V6 V7 
1 2 2 3 3 3 1 2 
2 2 4 4 1 3 4 4 
3 3 3 2 2 3 4 2 
4 1 3 3 2 3 3 4 
5 3 1 4 3 2 2 3 
> prob1 
     [,1] [,2] [,3] [,4] [,5] [,6] [,7] 
[1,] 0.133 0.449 0.103 0.249 0.467 0.193 0.241 
[2,] 0.186 0.472 0.088 0.359 0.106 0.007 0.300 
[3,] 0.286 0.330 0.344 0.496 0.326 0.191 0.247 
[4,] 0.454 0.315 0.192 0.190 0.063 0.435 0.093 
[5,] 0.101 0.031 0.385 0.389 0.134 0.170 0.414 
> prob2 
     [,1] [,2] [,3] [,4] [,5] [,6] [,7] 
[1,] 0.601 0.972 0.781 0.928 0.834 0.749 0.515 
[2,] 0.854 0.573 0.627 0.988 0.700 0.583 0.591 
[3,] 0.791 0.918 0.883 0.621 0.920 0.685 0.907 
[4,] 0.592 0.739 0.599 0.728 0.584 0.982 0.936 
[5,] 0.972 0.779 0.709 0.547 0.680 0.575 0.762 
+0

如果随机值大于'prob1'和'prob2',那么原始调查响应是否保持不变? – Gregor

+0

是的。如果价值大于两者,则不需要做任何事情。 –

回答

3

如果我理解正确的话,您尝试访问以下指标

idx <- cbind(seq_along(vec),c(vec)) 

下,你想改变df其中

ind99 <- ran < prob2[idx] 
ind09 <- ran < prob1[idx] 

所以

df[idx[ind99,]] <- 99 
df[idx[ind09,]] <- 9 
 
    V1 V2 V3 V4 V5 V6 V7 
1 2 2 99 3 3 1 2 
2 2 4 4 1 99 4 4 
3 3 9 2 2 3 4 2 
4 1 3 9 2 3 3 4 
5 99 1 4 3 2 2 3 
+0

非常感谢!因为我不是R的专家,所以我没有真正知道'prob2 [idx]'返回相应的五个概率,'0.781 0.700 0.918 0.599 0.972'您能解释一下吗? –

+0

查看用于索引'?'的帮助文件['',开始的部分“,第三种索引形式是通过数字矩阵,每个维度都有一列。 –

+0

明白了。我希望为你的答案投票一百万次。非常感谢!! –