2017-07-28 83 views
1

有没有办法找出工作被slurm取消的原因?我想区分资源限制因所有其他原因而受到影响的情况(如手动取消)。如果遇到资源限制,我也想知道哪一个。访问slurm停止工作的原因

回答

1

slurm日志文件明确包含该信息。它也被写入作业的输出文件的东西,如:

JOB <jobid> CANCELLED AT <time> DUE TO TIME LIMIT 

Job <jobid> exceeded <mem> memory limit, being killed: 

JOB <jobid> CANCELLED AT <time> DUE TO NODE FAILURE 

相关问题