运行多个任务同时在r中

rm(list=ls()) 

mat<-data.frame(matrix(NA,32,11)) 

mat[c(1,11,21),]<-mtcars[c(1,11,21),] 

tasks <- list(

    job1 = function(){repeat{na<-which(is.na(mat1[,1]));mat1[na,]=mat1[na-1,];if(all(is.na(mat1[,1])==F)==T)break}mat1}, 

job2 = function(){repeat{na<-which(is.na(mat2[,1]));mat2[na,]=mat2[na-1,];if(all(is.na(mat2[,1])==F)==T)break}mat2}, 

    job3 = function()repeat{na<-which(is.na(mat3[,1]));mat3[na,]=mat3[na-1,];if(all(is.na(mat3[,1])==F)==T)break}mat3}, 

    # To check that the computations are indeed running in parallel. 

    job4 = function() for (i in 1:5) { cat("4"); Sys.sleep(1) }, 

    job5 = function() for (i in 1:5) { cat("5"); Sys.sleep(1) }, 

    job6 = function() for (i in 1:5) { cat("6"); Sys.sleep(1) } 

) 

mat<-data.frame(matrix(NA,32,11)) 

mat[c(1,11,16),]<-mtcars[c(1,11,21),] 

mat1<-mat[1:10,] 

mat2<-mat[11:15,] 

mat3<-mat[16:32,] 

cl <- makeCluster(length(tasks)) 

clusterExport(cl, list("mat1","mat2","mat3"))  # make sure mtcars is loaded 

out <- clusterApply(cl, tasks, function(f) f()) 

stopCluster(cl)

来源

2014-07-18 789372u

可否请您提供适合上述任务的语法。 – 789372u

试试这个：

cl <- makeCluster(length(tasks)) 
clusterExport(cl, "mat") 
out <- clusterApply(cl, tasks,function(f) f())

你需要做的对象提供给工作进程。这由clusterExport完成。

此外，请注意您的功能有点奇怪。在每个工作进程中完成相同的任务，这可能不是你打算做的。请注意，简单地写mat[1:10]只是打印相应的输出，没有别的。尝试以下

job1 = function() { 
    mat <- mat[1:10, ];    # note the difference here 
    repeat{ 
    na<-is.na(mat[,1]); 
    mat[na,] <-mtcars[na,]; 
    if(all(is.na(mat[,1]))==F) break} 
    }

对其他工作做类似的调整。然后调用

cl <- makeCluster(length(tasks)) 
clusterExport(cl, list("mat", "mtcars"))  # make sure mtcars is loaded 
out <- clusterApply(cl, tasks, function(f) f()) 
stopCluster(cl)

这是仍有小幅低效率的，因为你是整个矩阵输出到每个工作进程，然后只使用一个子集。但我想这个原理是可以理解的。

来源

2014-07-18 10:12:22 coffeinjunky

如果我运行上面的行，我得到6个空列表。 – 789372u

从第一份工作中，我想知道在哪里（在哪个记录中），我在mat [1:10，]中有NA值，我想用另一个数据集替换那些记录集相同的记录。这里两个数据集具有相同的维度。 – 789372u

请给我你的电子邮件ID我会给你我的代码... – 789372u

运行多个任务同时在r中

回答

相关问题