我会用plyr
这一点。但是,第一次读到您的数据:
dat = read.csv(textConnection("1 0
1 2
1 3
1 5
1 9
1 4
1 7
1 11
1 8
2 3
2 4
2 2
3 9
3 0
4 0
5 0
5 13
6 22
6 0"), header = FALSE, sep = "")
和装载plyr后,我想找到V1
独特的类别,其只有在V2
列的值等于neg
,导致列表:true_values
。
require(plyr)
neg = 0
test = ddply(dat, .(V1), summarise, bool = all(V2 == neg))
> test
V1 bool
1 1 FALSE
2 2 FALSE
3 3 FALSE
4 4 TRUE
5 5 FALSE
6 6 FALSE
true_values = test[["V1"]][test[["bool"]]]
> true_values
[1] 4
一旦我们有了这个列表中,我们可以子集原始数据集:
> dat[dat[["V1"]] %in% true_values,]
V1 V2
15 4 0
或者,我们可以生成一个布尔值向量直接指定从dat
选择哪些元素:
test = ddply(dat, .(V1), mutate, bool = all(V2 == neg))
...并执行子集:
> dat[test[["bool"]],]
V1 V2
15 4 0
当NEG有多个值 – user1723765
这也是没有在你的问题中指定这不起作用。如果您需要更具体的答案,请添加更多详细信息。 –
以及NEG可以是一个矢量说NEG = 0,1,3,5,7然后我想测试负 – user1723765