我有5个变量y, x_1, x_2, x_3, x_4
的时间序列观察结果,其任务是找出哪个x
es负责y
中的变化。现在的问题是,它们都是强相互关联的并且表现出共线性。 x_1, x_2, x_3, x_4
没有隐藏的组件,它们是成对的或以任何其他方式共有的 - 它们只是自然相关的。分析R中的相关数据:线性,岭回归,PCR
预见的是,线性回归给出了系数去除的变量,它是高度共线数据一个正常的图像中的一个之后,改变似地不合理的结果。
诚如上wiki,一些补救措施多重共使用岭回归和主成分回归。然而,当我使用lm.ridge
方法,它给了我一模一样的系数作为lm
。
灿PCR帮助在这种情况下,如果是这样,什么是R中一个简单的方法来检索它的系数和p值?类似于lm
函数的汇总表。
用于'MASS :: lm.ridge'你可能被忽视的设定非零'lambda'(惩罚系数),在这种情况下,函数默认为'lambda = 0',即规则的无限回归。 (对于'lm.ridge'的文档是相当粗略的 - 你可能去获得*现代应用统计的副本,如果你想了解如何使用此功能的指导S *(维纳布尔斯和里普利)... –
是,你可能是正确的,将检查出来,到这里报到... – sashkello
很不错的书的确是 - !谢谢你指向它,并且有一个看似合法的免费的PDF版本可在网上 – sashkello