2017-04-25 110 views
1

我有一个缺失约13,000个关卡的因子(我的因子中有大约13,00个缺失值/ NA)。如何将数据分组以仅包含缺失级别的特定列?设置丢失因子的数据框

dat$xyz <- as.factor(dat$xyz) 
    subsetdf <- dat[which(dat$xyz == "NA"),] 

这将返回一个新的数据帧,其中所有原始变量的观测值为零。任何帮助,将不胜感激!

谢谢。

+1

试试这个:subsetdf < - 逸[其中(is.na(DAT $ XYZ)] – sconfluentus

+0

Blammo工程就像一个魅力谢谢!! – Starbucks

+1

欢迎你这是一个怪胎。的“NA”不等于“NA”的R ... – sconfluentus

回答

1

谢谢Sconfluentus

subsetdf <- dat[which(is.na(dat$xyz),] 
0

仅供参考,您不需要which(),为is.na()返回boolean载体。 which将布尔值转换为TRUE值的位置向量。

尝试subsetdf <- dat[is.na(dat$xyz),]