2017-10-11 74 views
0

我有一个包含近9000行和200列的数据集。一些数据点丢失。我怎样才能创建一个变量的排名(例如在一个表格中),以便他们能够根据缺失条目的数量进行排序?根据缺失值的数量对列进行排序

回答

1

大概是这样的:

sort(colSums(sapply(datfrm, is.na))) 

与功能性语言如R有时想想读代码通过应用is.na功能开始在“内部”的方式,然后在“您的工作出路“到最终条件(排序)。如果您首先想要最少丢失的列,您将设置, decreasing = TRUE,因为排序的默认值是升序。

如果你想排序的数据帧中的列(因此需要从用于排序的列,结果另一抽取功能),它可能是:

datfrm[ , names(sort(colSums(sapply(datfrm, is.na))))] 
相关问题