2015-10-13 35 views
0

在下面的代码,做我需要按照方法1或方法2 我很困惑,为什么在要使用的测试数据预测,因为每个方法1。 如果有人能够详细解释它会很棒。为什么预测()中的R,必须对测试数据进行

train <- sample(nrow(sales), nrow(sales)*0.6) 
test <- sales[-train] 

方法1

fit <- lm(y~x,data=train) 
predict(fit,data=test) 

相反,我不能做到这一点的方法:
方法2

fit <- lm(y~x,data=train) 
predict(fit,data=train) 

fit1 <- lm(y~x,data=test) 
predict(fit1,data=test) 
+0

有什么错误/输出? –

+0

我没有收到任何错误?只是想知道哪种方法更好,为什么更好 – user3493414

回答

0

使用训练的训练数据的模型一般来说,predict(),适用于训练数据,只能用于对训练后的模型进行反思。将它应用于(理想的独立的)测试数据可以作为验证训练模型或使用模型进行进一步预测。

换句话说,他们不是不同的方法做同一件事;他们完成完全不同的事情。

相关问题