我正在使用降雪进行并行计算。我总是只在一台机器上安装多个CPU(> 20个内核)。我正在处理大量数据(> 20GB)。 sfExport()需要很长时间。什么时候需要使用sfExport(R降雪包)
当我在我的笔记本电脑上运行我的测试代码并检查CPU使用情况时,有时也会在没有sfExport()的情况下运行。
我的代码的某些部分嵌套了sfLapply()函数。像:
func2 <- function(c,d, ...) {
result <-
list(x = c+d,
y = ..,
...
)
return(result)
}
func1 <- function(x, a, b, c, ...) {
library(snowfall)
d <- a+b
result <- sfLapply(as.list(b$row), func2, c, d, ...)
return(result)
}
result <- sfLapply(as.list(data.table$row), func1, a, b, c, ..)
我什么时候需要将数据导出到所有CPU?
感谢和问候 尼科