2011-10-27 127 views
21

卸下行我有以下的数据帧:从R数据帧

> str(df) 
'data.frame': 3149 obs. of 9 variables: 
$ mkod : int 5029 5035 5036 5042 5048 5050 5065 5071 5072 5075 ... 
$ mad : Factor w/ 65 levels "Akgün Kasetçilik   ",..: 58 29 59 40 56 11 33 34 19 20 ... 
$ yad : Factor w/ 44 levels "BAKUGAN","BARBIE",..: 1 1 1 1 1 1 1 1 1 1 ... 
$ donem: int 201101 201101 201101 201101 201101 201101 201101 201101 201101 201101 ... 
$ sayi : int 201101 201101 201101 201101 201101 201101 201101 201101 201101 201101 ... 
$ plan : int 2 2 3 2 2 2 7 3 2 7 ... 
$ sevk : int 2 2 3 2 2 2 6 3 2 7 ... 
$ iade : int 0 0 3 1 2 2 6 2 2 3 ... 
$ satis: int 2 2 0 1 0 0 0 1 0 4 ... 

我想从该数据帧中移除21个的特定行。

> a <- df[df$plan==0 & df$sevk==0,] 
> nrow(a) 
[1] 21 

所以,当我删除这21行时,我将有一个新的数据框与3149 - 21 = 3128行。我发现以下解决方案:

> b <- df[df$plan!=0 | df$sevk!=0,] 
> nrow(b) 
[1] 3128 

上述我的解决方案使用经修饰的逻辑表达式(!=代替==|代替&)。除了修改原始逻辑表达式,我怎样才能获得没有这21行的新数据框?我需要类似的东西:

> df[-a,] #does not work 

编辑(尤其是downvoters,我希望他们明白,为什么我需要一个替代的解决方案):我问了不同的解决方案,因为我正在写一个长码,和在我的代码的各个部分中有各种变量赋值(如我的示例中的a)。所以,当我需要在代码的前进部分中删除行时,我不想回去尝试在类似于a的表达式中编写逻辑表达式的反转。这就是为什么df[-a,]对我更有用。

+0

-1你必须包含在问题中的解决方案。没有问题需要解决(因为目前的问题措辞)。 –

+1

@RichieCotton:我的解决方案使用了一个修改过的(不同的)逻辑表达式,最终得到我需要的结果;但我想看到的是如何从数据框中删除特定的行。我在我的问题中包含了我的解决方案,因为我不想在答案中看到它。 –

+0

我已经在我的问题中添加了几行以解释我想知道的内容。 –

回答

12

可以使用rownames指定一个“互补”数据帧。它如果他们更容易数值rownames:

df[-as.numeric(rownames(a)),] 

但更通常可以使用:

df[setdiff(rownames(df),rownames(a)),] 
+0

当然这里假定你有rownames,OP在这种情况下做的,但它不是一个通用的解决方案 –

+5

'rownames(df)< - 1:nrow(df)' – James

2

你快到了。 “一个”必须是索引的矢量:

df <- data.frame(plan=runif(10),sevk=runif(10)) 
    a <- c(df$plan<.1 | df$sevk < .1) # some logical thing 
    df[-a,] 

,或者与您的数据:

a <- c(df$plan==0 & df$sevk==0) 
    df[-a,] 
+0

我试着用我的数据代码的最后两行,但它给出了错误的结果(3148行而不是3128)。 (顺便说一下,'b [-a,]'应该是'df [-a,]'我猜) –

+0

对于slop的抱歉 - 它与我上面的自包含的小示例一起工作,所以我想无论您的情况如何数据已经超过我的脑袋 –

0

我不明白为什么你反对你的解决方案,但这里的另一种方式。

which(df[df$plan==0 & df$sevk==0,], arr.ind=TRUE) ->killlist 
newdf <- df[-c(killlist[1,])] 
9

您是在查找subset()

dat <- airquality 
dat.sub <- subset(dat, Temp > 80 & Month < 10) 

dim(dat) 
dim(dat.sub) 

适用于你的例子:

df.sub <- subset(df, plan != 0 & sevk != 0) 
+0

这与我的解决方案:'df [df $ plan!= 0 | df $ sevk!= 0,]'选择一个子集;但无论如何感谢。 –

+0

顺便说一句,'&'运算符必须是'subset(df,plan!= 0&sevk!= 0)'中的'|'(OR)运算符。 –

+0

这是一个非常好的解决方案! – Brian

14

就否定了你的逻辑下标:

a <- df[!(df$plan==0 & df$sevk==0),]