2012-09-24 40 views
2

我有5个变量y, x_1, x_2, x_3, x_4的时间序列观察结果,其任务是找出哪个x es负责y中的变化。现在的问题是,它们都是强相互关联的并且表现出共线性。 x_1, x_2, x_3, x_4没有隐藏的组件,它们是成对的或以任何其他方式共有的 - 它们只是自然相关的。分析R中的相关数据:线性,岭回归,PCR

预见的是,线性回归给出了系数去除的变量,它是高度共线数据一个正常的图像中的一个之后,改变似地不合理的结果。

诚如上wiki,一些补救措施多重共使用岭回归和主成分回归。然而,当我使用lm.ridge方法,它给了我一模一样的系数作为lm

灿PCR帮助在这种情况下,如果是这样,什么是R中一个简单的方法来检索它的系数和p值?类似于lm函数的汇总表。

+1

用于'MASS :: lm.ridge'你可能被忽视的设定非零'lambda'(惩罚系数),在这种情况下,函数默认为'lambda = 0',即规则的无限回归。 (对于'lm.ridge'的文档是相当粗略的 - 你可能去获得*现代应用统计的副本,如果你想了解如何使用此功能的指导S *(维纳布尔斯和里普利)... –

+0

是,你可能是正确的,将检查出来,到这里报到... – sashkello

+0

很不错的书的确是 - !谢谢你指向它,并且有一个看似合法的免费的PDF版本可在网上 – sashkello

回答

6

看一看

曼等人。 (2012年)。共线性:审查处理 它的方法和评估其性能的模拟研究。 paywallalternative link

为可用的方法进行审查。

R-代码和数据可用here :)

+0

谢谢你看起来很有趣,会得到 – sashkello

+0

非常好,一些有用的信息里面和有用的例子。谢谢! – sashkello

+0

你好。 什么R包你建议用于岭回归?glmnet,bigRR,Mass,其他? 其中任何能够处理重复措施(随机效应)? – skan