2012-04-22 50 views
1

我对我的数据框的四列做了princomp分析,发现第一个组件比其他三个组件重要得多。如何在主成分分析之后拟合线性模型

现在我想仅使用第一个组件来拟合线性模型。如何获得仅由该组件组成的新数据?

据我所知,有一些矩阵乘法涉及,但我不知道如何做到这一点。我搜索了Google,并且找不到任何可理解的东西。

+1

第一个组件总是“最重要的”。您可能还想使用并行分析来确定应该提取多少个组件。另外,请查看pcl软件包中的'pcr'函数以进行PCA回归(尽管我自己从未使用过) – 2012-04-22 13:08:17

+0

另一方面,其他PC中的其中一台可能与您的响应实际相关。最好使用设计用于回归的降维方法,这是你想要做的。 – Aaron 2012-04-23 03:50:00

回答

3

得分是使用主成分的变换数据。我认为prcompprincomp产生这些作为输出。然后只需选择第一列。请参阅princompprcomp?prcomp?princomp)的文档,具体位于值部分(描述函数返回的内容)和示例部分。

+0

他们如何让他们成为输出?我如何获得该专栏?这是我无法弄清的!我能看到的只是对差异贡献的结果。 – 2012-04-22 11:48:01

+3

请参阅'?princomp',其中表示分数位于名为'scores'的列表元素中。所以,如果你做了'ans < - princomp(数据等)',那么'ans $ scores [,1]'包含你的第一组分数(每个对象/样本一个,所以这就是你想要的线性拟合)。根据你如何使用'princomp',注意'scores = TRUE'参数 – 2012-04-22 11:52:37