2012-09-27 69 views
0

我试图在R中运行逐步回归,其中600个奇数变量包含在.csv文件头部的列名中。如何在R中使用数据头作为变量名称

如何将列名称用作回归方程中的变量?

我很新的这一点,我有限的了解它,我可以列保存为一个列表,并用它来运行GLM如

model.1 <- glm(x~ paste(list), family= poisson, link = logit).

任何帮助,高度赞赏。在此先感谢

+1

也许你不必使用'〜.'而是使用'lm(mpg〜。,data = mtcars)' –

+0

当你用'header = TRUE'选项将文件读入R时,名称是变量名称。 –

回答

3

如果您已正确读取了您的数据(例如使用上述注释中指定的header=TRUE),则应以600 +列数据框(1列为x响应,以及一列对于每个预测变量):现在我将调用mydata。在这种情况下,@TylerRinker建议你可以包含所有的预测变量:glm(x~.,data=mydata,family=poisson)(logit链接是默认链接;如果你想明确指定它,你可以说glm(x~.,data=mydata,family=poisson(link="logit")),然后你可以使用MASS包中的stepstepAIC

然而,我必须补充一点,除非你知道自己在做什么,对600个变量逐步回归是从统计角度来看(如“谷歌逐步东西真的,真的,真的不好想法回归问题“或”逐步回归Harrell“)。我强烈建议您看看如glmnet包,这需要一个更明智的方法来建模lo预测指标。

+0

谢谢@Tyler,@Patrick! @ Ben!感谢您提供更多建议,正如您正确地指出,逐步采用一个好主意。我已经探索过glmnet软件包,它对我的​​工作看起来很有希望。 – Arihant

相关问题