1
要减轻lockfile problem,直到我找到一个合适的解决方案,我想指示LSF最多为我的每个主机提供一个作业。 -x flag确保我的工作有独家使用的主机,但我不需要这个;我很好与他人分享。我只是不想与我分享。每个主机只放一个我的工作,但可以与他人共享
如何确保我的作业中至多有一个作业在特定主机上运行,而不要求独占使用整个主机?
要减轻lockfile problem,直到我找到一个合适的解决方案,我想指示LSF最多为我的每个主机提供一个作业。 -x flag确保我的工作有独家使用的主机,但我不需要这个;我很好与他人分享。我只是不想与我分享。每个主机只放一个我的工作,但可以与他人共享
如何确保我的作业中至多有一个作业在特定主机上运行,而不要求独占使用整个主机?
您可以使用基于项目的一般限制。使用PER_HOST = all,JOBS = 1。然后将您的工作附加到该项目名称。 LSF管理员需要设置它。
基本上,这增加lsb.resources
Begin Limit
NAME = mylimit
PROJECTS = myproject
PER_HOST = all
JOBS=1
End Limit
与bsub -P myproject ...
提交作业。
如果您没有LSF管理员访问。然后稍微低调的做同样的事情是使用host exclude feature。 bsub -Q "EXCLUDE(55)" ...
当你的工作开始时,如果另一个同类型的工作正在运行,退出代码55.然后,LSF将重新执行工作并将该主机添加到作业特定的黑名单中。退出代码可以是55以外的其他代码,但请避免使用special meaning to the shell的退出代码。
我可以做普通用户吗?我没有管理权。 – gerrit
普通用户不能配置限制。普通用户的选项是使用[主机排除功能](http://www.ibm.com/support/knowledgecenter/SSWRJV_10.1.0/lsf_admin/job_requeue_user_config.html)。 ('bsub -Q“EXCLUDE(55)”...')。它有点笨拙,但会起作用。当你的工作开始时,如果另一个相同类型的工作正在运行,退出时使用代码55.然后LSF将重新执行作业并将该主机添加到作业特定的黑名单中。退出代码可以是55以外的其他内容,但不要使用带有[特殊含义](http://www.tldp.org/LDP/abs/html/exitcodes.html)的退出代码到shell。 –