本质上,我有一个大的数据框:10,000,000x900(行,列),我试图并行地转换每列的类。最终的结果必须是一个data.frameR并行大型数据帧转换
这里就是我有这么远:
假装df
是已经定义的数据帧,所有列是数字和字符类的混合物
library(snow)
cl=makeCluster(50,type="SOCK")
cl.out=clusterApplyLB(cl,df,function(x)factor(x,exclude=NULL))
cl.out
是我想要的,只是我需要的是这是一个data.frame类列表
所以这是我卡住...我要尝试,并结合所有的元素cl.out到data.frame w这不会是平行的吗? (SLOW,时间是个问题)
我可以使用不同的包来实现其他东西吗? (foreach?)
我必须硬编码一些c才能有效地完成这项工作吗?
任何帮助,将不胜感激。
感谢,
转换是相当缓慢的使用过程。我相信还有比简单地将类属性附加到数据blob上更多的东西。 –
它不是很干净,但可以尝试直接更改属性: 'class(cl.out)< - “data.frame”'。 –