torque

    1热度

    2回答

    我有一个shell脚本,它将多个任务排队等待在HPC群集上执行。相同的作业提交脚本适用于具有一些次要条件逻辑的扭矩或电网引擎。这是一个管道,将早期任务的输出提供给后续任务以供进一步处理。我使用qsub来定义作业依赖关系,因此稍后的任务会在开始执行之前等待先前的任务完成。到现在为止还挺好。 有时,任务失败。发生故障时,我不希望任何相关任务尝试处理失败任务的输出。但是,依赖任务已经排队等待很长时间才发

    1热度

    1回答

    这里是我的PBS文件: #!/bin/bash #PBS -N myJob #PBS -j oe #PBS -k o #PBS -V #PBS -l nodes=hpg6-15:ppn=12 cd ${PBS_O_WORKDIR} ./mycommand 上的qsub文档页面,就好像如果我放线 PBS -k o,我应该能够检查实实时输出到我的主目录中名为myJob.oJOBID

    1热度

    1回答

    我正在尝试将大型作业数组提交给群集。 qsub请求失败,产生Bad job array request error。我认为这是因为我的作业数组太大了。我如何读取允许的最大作业数组大小?我认为这存储在一个名为max_array_size的参数中,但我不确定。 请注意,我不是此群集的管理员。我只有用户权限。

    4热度

    3回答

    我正在使用具有Torque/Maui系统的群集。我有一个bash脚本,使用qsub命令提交一个作业,然后执行几个操作,例如移动文件,编写ASCII文件,并检查我提交的作业的输出。关于这个输出,基本上,如果它包含数字1,则该作业需要再次提交。如果不同1,bash脚本会做其他事情。 问题是qsub在后台运行,并且所有的bash都是一次性评估的。我希望强制qsub的行为与awk,cat,sort等类似.

    1热度

    1回答

    喜欢的东西: #PBS -t 0-99 #PBS -d "~/$PBS_ARRAYID.output" 我想在这里做的是重新定义的工作阵列中的每个单独作业的工作目录,使用作业的阵列ID。这是有效的代码吗? 我在发送到集群之前需要知道,因为我无法在那里运行测试。

    0热度

    1回答

    我有我的剧本的开头以下行: #!/bin/bash #PBS -j oe #PBS -o ~/output/a 与qsub提交此脚本后,作业完成后,有~/output/下没有文件a。我在这里错过了什么?

    1热度

    1回答

    我有一个使用扭矩作业数组处理大量数据的matlab脚本。 我SSH到服务器缺乏加载在第一位置的数据的存储器,所以需要请求计算节点资源作为转矩工作,如下所示: qsub -I -V -l nodes=1:ppn=1,walltime=12:00:00,vmem=80G 然而,当我现在运行matlab脚本我无法提交扭矩作业数组请求。我得到的错误如下: qsub: submit error (Job

    0热度

    1回答

    我想向群集提交几个作业,但我希望只有在队列上没有其他作业时才能执行它们。我怎样才能做到这一点? 该集群使用TORQUE + MAUI管理系统。

    0热度

    1回答

    所以我在同一时间运行这些下面的PBS文件的节点数量: 的qsub到/ mnt /文件夹/ p​​rueba1_1 的qsub到/ mnt /文件夹/ p​​rueba01 一个这里的文件 prueba1_1 #!/bin/bash #PBS -N pruebaF #PBS -V #PBS -l nodes=1:ppn=1 #PBS -q batch #PBS -j eo cd /mnt

    1热度

    1回答

    有没有办法限制直接运行脚本的用户的cpus和内存,但允许更多的作业提交cpus和内存? 我在Ubuntu 14.04服务器上运行转矩/ pbs,并希望允许8 cpu和16 GB RAM的“正常”使用,其余部分将专用作群集的“妈妈”资源。正常的cgroups/cpuset配置也会限制正在运行的作业。