2017-07-26 62 views
0

有人可以帮助我解释在多重回归模型中测试多重共线性的别名函数输出。我知道我模型中的一些预测变量高度相关,我想用别名表来标识它们。解释别名表R测试模型的多重共线性

Model : 
Score ~ Comments + Pros + Cons + Advice + Response + Value + Recommendation 
+ 6Months + 12Months + 2Years + 3Years + Daily + Weekly + Monthly 

Complete : 
      (Intercept) Comments Pros Cons Advice Response Value1 
UseMonthly1  0   0 0 0 0  0   0     
      Recommendation1 6Months1 12Months1 2Years1 
UseMonthly1 0    1  1  1    
      3Years1 Daily1 Weekly1 
UseMonthly1 1   -1  -1  

价值,建议,6个月,12个月,2年,3年,每日,每周和每月的二元分类变量。
评分,评论,赞成,反对,建议和回应是数字变量。

我可以假设UseMonthly与6个月,12个月,2年,3年,每日,每周高度相关吗?别名输出中的1和-1值有什么区别?它是正面的和负面的相关性?

回答

0

“完整”矩阵中的非零项表明这些项与线性依赖于UseMonthly。这意味着它们高度相关,但术语可以高度相关而不依赖于线性。

如果您的目的是识别和删除相关变量,您应该删除UseMonthly,但您可能还需要删除其他人。识别可能在多重共线性方面存在问题的变量的常用方法是搜索大的方差膨胀因子(通过例如car::vif计算)。