1
我想知道是否需要在R中对我的样本进行PCA转置数据。我正在使用内置函数prcomp()。我的数据集是RNA seq表达数据,列是样本,行是基因表达。它看起来有效,但是对行/列应该有什么共识?谢谢!使用prcomp在R中的RNA序列的PCA
我想知道是否需要在R中对我的样本进行PCA转置数据。我正在使用内置函数prcomp()。我的数据集是RNA seq表达数据,列是样本,行是基因表达。它看起来有效,但是对行/列应该有什么共识?谢谢!使用prcomp在R中的RNA序列的PCA
大多数生物统计R包通过转置数据帧来完成此操作。我会给你一个证明:
RUV SVD因子分解法在RNA-Seq中很常见。看它的源代码:
https://github.com/drisso/RUVSeq/blob/master/R/RUVg-methods.R
if(isLog) {
Y <- t(x)
} else {
Y <- t(log(x+epsilon))
}
x
是基因矩阵表。你看到转置操作吗?后来在代码中,程序包将转置矩阵(Y)赋予svd
函数。
svdWa <- svd(...)
为了使生活和其他人更容易,你可以把它放到你的列基因和样品中的行。
事实上,它会“以任何方式工作”,在数学上讲。但是,对于大多数数据分析,列包含感兴趣的变量(在您的情况下是基因),行包含这些变量的观察值(您的案例中的样本)。 – neilfws
谢谢@neilfws!为了澄清,我有兴趣看到样本之间的关系,使用基因作为载体。那么基因还应该在列中吗? –