2012-09-26 80 views
0

47个obs和5个变量的数据集(男性编码为0,女性为1)试图预测男性的平均状态,收入和口头会花在95%CI上。R预测区间

我用我的lm<-spending ~ status + income + verbal + sex, teenspend来获得平均值。 我发现我的系数为:

mdl$coefficient 
(Intercept) sexfemale  status  income 
22.55565063 -22.11833009 0.05223384 4.96197922 
     verbal 
-2.95949350 

predict(mdl, sex=0, interval='confidence', level=0.90) 

一些问题:我用上面的预测,但我得到的所有的意见,我怎么找到我的预测?

 fit   lwr  upr 
1 -10.6507430 -21.4372267 0.1357407 
2 -9.3711318 -21.9428731 3.2006095 
3 -5.4630298 -15.0782882 4.1522286 
4 24.7957487 12.5630143 37.0284831 

请澄清一下?

回答

0

查看predict.lm的文档,你会发现在这里不能使用参数sex=0。预测方法会忽略该参数,因此您会得到数据中所有观测值的拟合值加置信区间。您可以指定下列方式预测:
predict(mdl, newdata=teenspend[teenspend$sex==0,], interval="confidence")
如果你确实需要一个预测区间 - 你在你的问题的标题中使用它 - 你应该选择interval="prediction"