0
我在使用决策树(CART)进行预测时遇到问题。插入符号包中的决策树中的预测问题
我有这样的代码:
training <- read.csv("pml-training.csv", header=TRUE)
set.seed(1972)
inTrain <- createDataPartition(y=training2$classe, p=0.6, list=FALSE)
wk_training <- training2[inTrain,]
wk_testing <- training2[-inTrain,]
wk_trainng数据集有11776个VAR和wk_testing对wk_testing 7846.
set.seed(1972)
model_dt <- train(wk_training$classe ~ ., data = wk_training, method="rpart")
print(model_dt, digits=3)
运行
predictions_dt <- predict(model_dt, newdata=wk_testing)
那么我期待predictions_dt有7846行因为它有wk_testing, ,但predictions_dt只有165行
我不知道我在做什么错...
任何人都可以帮我吗?
在此先感谢
代码中定义的'training2'变量在哪里?你有可能在你的代码中犯了一个错字,并使用错误的变量吗? – giliev
我从训练创建training2这样的: NZV < - nearZeroVar(培训,saveMetrics = TRUE) #消除接近零个值 COLS < - NZV $ NZV == FALSE training2 < - 训练[,COLS] –