这是我写的一小段代码,用于报告数据框中缺失值的变量。我试图想到一个更优雅的方式来做到这一点,也许返回data.frame,但我坚持: for (Var in names(airquality)) {
missing <- sum(is.na(airquality[,Var]))
if (missing > 0) {
print(c(Var,missing))
我想,以适应随机森林模型,但是当我打电话 library(randomForest)
cars$speed[1] <- NA # to simulate missing value
model <- randomForest(speed ~., data=cars)
我收到以下错误 Error in na.fail.default(list(speed = c(NA, 4, 7, 7, 8
我有一些数据,看起来像这样: ID lat long university date cat2 cat3 cat4 ...
00001 32.001 -64.001 MIT 2011-07-01 xyz foo NA ...
00002 45.783 67.672 Harvard 2011-07-01 abc NA lion ...
00003 54.823 78.76