插入符号包中的决策树中的预测问题

我有这样的代码：

training <- read.csv("pml-training.csv", header=TRUE) 
set.seed(1972) 
inTrain <- createDataPartition(y=training2$classe, p=0.6, list=FALSE) 
wk_training <- training2[inTrain,] 
wk_testing <- training2[-inTrain,]

wk_trainng数据集有11776个VAR和wk_testing对wk_testing 7846.

set.seed(1972) 
model_dt <- train(wk_training$classe ~ ., data = wk_training, method="rpart") 
print(model_dt, digits=3)

运行

predictions_dt <- predict(model_dt, newdata=wk_testing)

那么我期待predictions_dt有7846行因为它有wk_testing，，但predictions_dt只有165行

我不知道我在做什么错...

任何人都可以帮我吗？

在此先感谢

来源

2015-08-19 Juan Vidal

代码中定义的'training2'变量在哪里？你有可能在你的代码中犯了一个错字，并使用错误的变量吗？ – giliev

我从训练创建training2这样的： NZV < - nearZeroVar（培训，saveMetrics = TRUE）＃消除接近零个值 COLS < - NZV $ NZV == FALSE training2 < - 训练[，COLS] –

如果你有缺失值，则predict功能默认为na.action = na.omit。您可以使用na.action = na.fail来测试这是否是问题。如果是这种情况，您可能需要进行估算。请参阅train中的preProcess选项。

来源

2015-08-21 15:17:46 topepo

插入符号包中的决策树中的预测问题

回答

相关问题