从R数据帧

卸下行我有以下的数据帧：从R数据帧

> str(df) 
'data.frame': 3149 obs. of 9 variables: 
$ mkod : int 5029 5035 5036 5042 5048 5050 5065 5071 5072 5075 ... 
$ mad : Factor w/ 65 levels "Akgün Kasetçilik   ",..: 58 29 59 40 56 11 33 34 19 20 ... 
$ yad : Factor w/ 44 levels "BAKUGAN","BARBIE",..: 1 1 1 1 1 1 1 1 1 1 ... 
$ donem: int 201101 201101 201101 201101 201101 201101 201101 201101 201101 201101 ... 
$ sayi : int 201101 201101 201101 201101 201101 201101 201101 201101 201101 201101 ... 
$ plan : int 2 2 3 2 2 2 7 3 2 7 ... 
$ sevk : int 2 2 3 2 2 2 6 3 2 7 ... 
$ iade : int 0 0 3 1 2 2 6 2 2 3 ... 
$ satis: int 2 2 0 1 0 0 0 1 0 4 ...

我想从该数据帧中移除21个的特定行。

> a <- df[df$plan==0 & df$sevk==0,] 
> nrow(a) 
[1] 21

所以，当我删除这21行时，我将有一个新的数据框与3149 - 21 = 3128行。我发现以下解决方案：

> b <- df[df$plan!=0 | df$sevk!=0,] 
> nrow(b) 
[1] 3128

上述我的解决方案使用经修饰的逻辑表达式（!=代替==和|代替&）。除了修改原始逻辑表达式，我怎样才能获得没有这21行的新数据框？我需要类似的东西：

> df[-a,] #does not work

编辑（尤其是downvoters，我希望他们明白，为什么我需要一个替代的解决方案）：我问了不同的解决方案，因为我正在写一个长码，和在我的代码的各个部分中有各种变量赋值（如我的示例中的a）。所以，当我需要在代码的前进部分中删除行时，我不想回去尝试在类似于a的表达式中编写逻辑表达式的反转。这就是为什么df[-a,]对我更有用。

来源

2011-10-27 Mehper C. Palavuzlar

-1你必须包含在问题中的解决方案。没有问题需要解决（因为目前的问题措辞）。 –

@RichieCotton：我的解决方案使用了一个修改过的（不同的）逻辑表达式，最终得到我需要的结果;但我想看到的是如何从数据框中删除特定的行。我在我的问题中包含了我的解决方案，因为我不想在答案中看到它。 –

我已经在我的问题中添加了几行以解释我想知道的内容。 –

可以使用rownames指定一个“互补”数据帧。它如果他们更容易数值rownames：

df[-as.numeric(rownames(a)),]

但更通常可以使用：

df[setdiff(rownames(df),rownames(a)),]

来源

2011-10-27 12:04:05 James

当然这里假定你有rownames，OP在这种情况下做的，但它不是一个通用的解决方案 –

'rownames（df）< - 1：nrow（df）' – James

你快到了。 “一个”必须是索引的矢量：

df <- data.frame(plan=runif(10),sevk=runif(10)) 
    a <- c(df$plan<.1 | df$sevk < .1) # some logical thing 
    df[-a,]

，或者与您的数据：

a <- c(df$plan==0 & df$sevk==0) 
    df[-a,]

来源

2011-10-27 11:48:45

我试着用我的数据代码的最后两行，但它给出了错误的结果（3148行而不是3128）。（顺便说一下，'b [-a，]'应该是'df [-a，]'我猜） –

对于slop的抱歉 - 它与我上面的自包含的小示例一起工作，所以我想无论您的情况如何数据已经超过我的脑袋 –

我不明白为什么你反对你的解决方案，但这里的另一种方式。

which(df[df$plan==0 & df$sevk==0,], arr.ind=TRUE) ->killlist 
newdf <- df[-c(killlist[1,])]

来源

2011-10-27 12:08:36

您是在查找subset()？

dat <- airquality 
dat.sub <- subset(dat, Temp > 80 & Month < 10) 

dim(dat) 
dim(dat.sub)

适用于你的例子：

df.sub <- subset(df, plan != 0 & sevk != 0)

来源

2011-10-27 12:50:38 jthetzel

这与我的解决方案：'df [df $ plan！= 0 | df $ sevk！= 0，]'选择一个子集;但无论如何感谢。 –

顺便说一句，'＆'运算符必须是'subset（df，plan！= 0＆sevk！= 0）'中的'|'（OR）运算符。 –

这是一个非常好的解决方案！ – Brian

就否定了你的逻辑下标：

a <- df[!(df$plan==0 & df$sevk==0),]

来源

2011-10-27 15:03:08

回答

相关问题