2017-05-04 35 views
1

我想知道是否需要在R中对我的样本进行PCA转置数据。我正在使用内置函数prcomp()。我的数据集是RNA seq表达数据,列是样本,行是基因表达。它看起来有效,但是对行/列应该有什么共识?谢谢!使用prcomp在R中的RNA序列的PCA

+1

事实上,它会“以任何方式工作”,在数学上讲。但是,对于大多数数据分析,列包含感兴趣的变量(在您的情况下是基因),行包含这些变量的观察值(您的案例中的样本)。 – neilfws

+0

谢谢@neilfws!为了澄清,我有兴趣看到样本之间的关系,使用基因作为载体。那么基因还应该在列中吗? –

回答

0

大多数生物统计R包通过转置数据帧来完成此操作。我会给你一个证明:

RUV SVD因子分解法在RNA-Seq中很常见。看它的源代码:

https://github.com/drisso/RUVSeq/blob/master/R/RUVg-methods.R

if(isLog) { 
    Y <- t(x) 
} else { 
    Y <- t(log(x+epsilon)) 
} 

x是基因矩阵表。你看到转置操作吗?后来在代码中,程序包将转置矩阵(Y)赋予svd函数。

svdWa <- svd(...) 

为了使生活和其他人更容易,你可以把它放到你的列基因和样品中的行。