2012-09-27 21 views
2

我刚开始了解PCA,我希望将它用于超过4,00,000行的巨大微阵列数据集。我有我的样品列和基因/基因座形式的列。我在使用PCA时遇到了一些教程,并遇到了princomp()和prcomp()以及其他一些教程。如何在大数据集中使用R中的princomp()或prcomp()函数,而不会传输数据?

现在,正如我在这里所了解的那样,为了在双标图中绘制样本,我需要将它们放在行中,并将基因/位点放在列中,因此我将不得不转换我的数据在用于PCA之前。

但是,由于行数超过4,00,000,我不能将它们转换为列,因为列是有限的。所以我的问题是,是否有任何方法可以对我的数据执行PCA,而无需转换它,使用这些R函数?如果不是的话,你们中的任何人都可以建议我采取其他方式或方法吗?

回答

5

你为什么讨厌转置你的数据?这很容易!

如果你读了您的数据转换成R(例如,作为基体microarray.data),你可以只用一个命令转他们:

transposed.microarray.data<-t(microarray.data) 
+0

噢,是的..这工作.. :)它不是我恨换位..我试图在Excel文件,这没有工作。我没有意识到可以这样做..非常感谢你:) – Letin

相关问题