2012-05-03 57 views
0

在R中运行多重回归之后,回归总结指示具有恒星的重要变量。在我正在研究的数据集中,有近2000个变量,由R标识的重要变量包含50多个变量。从回归总结中可以单独获得重要变量的列表吗?在R中,如何在运行具有大量变量的多重回归之后仅提取重要变量

+1

这是一种不科学的调查方法。您的“重要”结果的百分比低于单凭偶然因素所预期的百分比。这意味着就结果而言,你可以有一个很大的“零”。尝试用随机数字设置数据矩阵,您将看到与您描述的内容非常相似的内容。 –

回答

10

这就是为什么你不应该做一个例子,你要我们做什么:

randf <- as.data.frame(matrix(rnorm(800*400), 800, 400)) 
names(randf)[1] <- "Y" 
big.mod <- lm(Y ~ ., data=randf) 
sum(summary(big.mod)$coefficients[ ,4] < 0.05) 
#[1] 22 

所以我们得到22个显著系数(他们中的一些“非常显著”)刚刚回归对400个随机变量另一个随机变量。