我在多节点Linux集群上运行R。我想在不使用并行计算软件(如MPI或雪)的情况下使用脚本或批处理模式在R上运行我的分析。R编程 - 使用PBS在多节点linux集群上提交作业
我知道这可以通过划分输入数据,使每个节点运行不同部分的数据。
我的问题是我该如何解决这个问题?我不知道我应该如何编写我的脚本。一个例子会非常有帮助!
我一直在使用PBS运行我的脚本,但它似乎只运行在一个节点上,因为R是单线程程序。因此,我需要弄清楚如何调整我的代码,以便将劳动力分配给所有节点。
这是我到目前为止已经做的:
1)命令行:
> qsub myjobs.pbs
2)myjobs.pbs:
> #!/bin/sh
> #PBS -l nodes=6:ppn=2
> #PBS -l walltime=00:05:00
> #PBS -l arch=x86_64
>
> pbsdsh -v $PBS_O_WORKDIR/myscript.sh
3)的MyScript .sh:
#!/bin/sh
cd $PBS_O_WORKDIR
R CMD BATCH --no-save my_script.R
4)my_script.R:
> library(survival)
> ...
> write.table(test,"TESTER.csv",
> sep=",", row.names=F, quote=F)
任何建议将不胜感激!谢谢!
-CC
您确定pbs启动多个实例吗? 尝试在作业批处理文件 – Anycorn 2010-06-29 21:25:35