2010-03-11 59 views
0

我目前正在使用ClusterVisionOS 3.1开发一个集群。这将是我第一次使用集群,所以我可能没有尝试过“明显”。有没有人有ClusterVisionOS上运行的集群的经验?

我可以提交一个作业到群集的“使用qsub”命令(这我得到正常工作)

但在一次提交多个作业时的问题开始。我可以写一个脚本,一次发送它们,但是所有的节点都会占用我的工作,并且有更多的人希望提交他们的工作。

所以这里的交易:

32个节点(4个处理器/每个插槽)

的最好的事情是告诉群集使用3个节点(12个处理器)和排队我对所有这些工作节点/处理器,如果这是可能的话。如果我可以让节点为每项工作使用1个处理器,那么这将是完美的。

回答

0

好吧,所以我想我发现了,这个问题没有解决方案。我的个人解决方案是编写一个通过ssh连接到集群的脚本,然后让脚本检查您的用户名下已有多少个作业正在运行。该脚本会检查该数字是否超出,例如可以说同时有20个作业。只要这个数字没有达到,它就会不断提交工作。

也许它是一个丑陋的解决方案,但一个工作!

关于处理器的事情,作业已经提交给不同的单处理器,充分利用节点的全部范围。

相关问题