-2
我有含5列器R并联执行
COL1 | COL2 | COL 3 | COL 4 | COL 5
我需要聚合在COL1和COL2应用4个不同的函数来COL5列的数据帧
a1<-aggregate(COL2 ~ COL1, data = dataframe, sum)
a2<-aggregate(COL3 ~ COL1, data = dataframe, length)
a3<-aggregate(COL4 ~ COL1, data = dataframe, max)
a4<-aggregate(COL5 ~ COL1, data = dataframe, min)
finalDF<- Reduce(function(x, y) merge(x, y, all=TRUE), list(a1,a2,a3,a4))
1)I有24个核心上机器。 如何并行执行4行代码(a1,a2,a3,a4)? 我想同时使用4个内核,然后使用减少计算finalDF
2)我可以使用不同的列不同的功能在一个聚合 (我可以在多个列中使用一个乐趣,我还可以在使用多个功能但是我无法在不同列上应用多个功能[COL2-sum,COL3-length,COL4-max,COL5-min])
如果'聚合'速度太慢,你应该使用data.table或dplyr来代替。速度增益预计会比因子4好得多。 – Roland
请提供一个可重现的示例,并说明数据的维度,以及您在真实数据集中唯一组的总数。如果您可以提供代码来生成代表您的真实数据集的样本数据,那更好。 – Arun