该文档是有点不清楚的正是-t
选项使用qsub
了解-t选项的qsub
http://docs.adaptivecomputing.com/torque/4-0-2/Content/topics/commands/qsub.htm
从文档的作业提交做:
- t指定作业数组的任务ID。单任务数组是允许的。 array_request参数是一个整数id或一个整数范围。 可以在逗号分隔列表中组合多个ID或ID范围。 例子:-t 1-100或-t 1,10,50-100
这里,我已经要求2个节点,每节点8个进程,以及16个作业阵列的例子出问题。我所希望的将会在2个节点间自然分配,但是16个任务分布在2个以上的节点上。
$ echo 'hostname' | qsub -q gpu -l nodes=2:ppn=8 -t 1-16
52727[]
$ cat STDIN.o52727-* | sort
gpu-3.local
gpu-3.local
gpu-3.local
gpu-3.local
gpu-5.local
gpu-5.local
gpu-5.local
gpu-5.local
gpu-5.local
gpu-5.local
gpu-7.local
gpu-7.local
gpu-7.local
gpu-7.local
gpu-7.local
gpu-7.local
你使用什么调度程序? – clusterdude