4
我有一个有49个变量和4M行的数据帧。我想计算49 x 49的相关矩阵。所有列都是类数字。加速R中的相关矩阵计算
这里有一个例子:
df <- data.frame(replicate(49,sample(0:50,4000000,rep=TRUE)))
我使用的标准cor
功能。
cor_matrix <- cor(df, use = "pairwise.complete.obs")
这需要很长时间。我有16GB RAM和一个i5单核2.60Ghz。
有没有办法让我的桌面计算速度更快?
您可能会检查[here](http://www.r-bloggers.com/bigcor-large-correlation-matrices-in-r/) – akrun
您的主要问题是'use =“pairwise.complete.obs” '。在我的系统上(用12列进行测试),需要花费5倍于use =“everything”的时间。 – Roland