试图在一个矩阵来计算特定基因(这里其基因1)与所有其它(35999个候选)的相关性一到以矩阵许多相关计算中的R
samp1 samp2 samp3 samp4
Gene 1 3.7891 2.4487 1.1939 0.6013
Gene 2 1.4484 3.2316 2.841 1.9545
Gene 3 0.4505 2.6062 2.0729 0.6403
.
.
Gene 36000 1.8828 5.2633 2.7552 1.7335
我用下面的代码
library(Hmisc)
A <- read.table("C:/Users/Desktop/exp.txt", header=T, sep="\t")
cor <- rcorr(as.matrix(A), type="pearson")
write.csv(cor$r,'C:/Users/Desktop/pCC VALUES.csv')
write.csv(cor$P,'C:/Users/Desktop/p VALUES.csv')
但上面的代码是矩阵计算36000 * 36000。但是,我想获得一对多相关性,其中感兴趣的基因始终是第一个基因。这里它的基因1.这将节省处理时间。一种方法显然是从输出中提取36000对我的兴趣。我想知道是否有其他方法可以找到我的基因与其他所有其他方法的相关性,而不需要多对多的计算。
编辑:
我正在寻找类似的格式输出,
Gene 1 Gene 2 pcc p-value
Gene 1 Gene 3 pcc p-value
.
.
Gene 1 Gene 36000 pcc p-value
end
您能否在此背景下澄清一对多含义?您想要将Gene1的4个样本与4个样本的35999个其他组相关联,一次一个?如果是这样,则不存在1对1的样本,这是35999个一对一样本。但也许我是误解。 –
@DominicComtois我同意使用'一对多'的术语令人困惑。我编辑了帖子并添加了我正在寻找的输出格式。与上面的代码预期几乎相同的结果,但它应该仅限于基因1的PCC对。 – Donjin