pbs

    0热度

    1回答

    我想测试pbsdsh是否适用于我的系统。我用下面的程序 我使用的是Linux服务器有两个64位四核英特尔至强处理器(24个计算节点 try.sh #!/bin/bash # Set up the path PATH=/usr/local/bin:$PATH export PATH # Make all hosts print out "Hello World" pbsdsh ec

    5热度

    3回答

    我想在我发送到服务器的所有作业都完成时运行脚本。 例如,我送 ssh server "for i in config*; do qsub ./run 1 $i; done" 我找回启动的作业清单。我想在服务器上自动启动另一个脚本,以便在完成所有这些作业后处理这些作业的输出。 我将不胜感激任何意见,这将有助于我避免以下不雅的解决方案: 如果我保存每个1000个作业标识的从上面呼叫一个单独的文件,

    0热度

    1回答

    我正在使用mpiexec来运行两个hello world可执行文件。它们每个都运行,但进程数总是1,看起来应该有4个进程。有人明白为什么吗?我也不确定stty为什么给我一个无效的论点。谢谢! 这里是输出: /bin/stty: standard input: invalid argument Hello world from process 0 of 1 Hello world

    1热度

    4回答

    我在一个研究小组工作,我们使用PBS排队系统。我不是PBS大师,但我想编写一个搜索工作是否正在运行的脚本。为此,我首先使用qstat调用的结果作为qstat -f的参数,然后获取所有作业的详细列表并搜索提交的文件路径,从而获取所有作业的字符串。目前kludge的立场如下 dump=`qstat -f `qstat`` if grep -q \ "/${compounds[$i]}/

    0热度

    1回答

    我想在多个节点上安排一个程序,我该怎么做。我刚接触编程,所以我得到了关于PBS的一些提示。我可以怎样做以下几点。 在前提前感谢

    1热度

    1回答

    我有一个包含10个节点的集群,所有这些节点都有类似的操作系统(Ubuntu 10.4)。我想要监视每个节点在给定时间基本捕获cpu,内存等的性能。如何我是否可以在每个节点上捕获相同的结果并汇总结果以获得组合结果示例整个集群的平均CPU使用情况。 是否有任何命令可以运行并获得结果。 在此先感谢。

    1热度

    1回答

    我注意到关于PBS的几个关于PBS的问题没有得到答复。有没有更合适的论坛来提出这些问题?例如: PBS programming? How to limit number of concurrently running PBS jobs? Submitting multiple jobs TORQUE/PBS? 我真正的问题:我有我的PBS配置的问题。我有一台电脑,我已经设置了扭矩,这样我就可以提交

    10热度

    4回答

    我有一个产生数字的函数(神经网络模型)。我希望使用PBS在带有Torque的标准集群上测试几个参数,方法和不同的输入(意味着数百次函数运行)。 注意:我尝试了parallelpython,ipython等,并且从来没有完全满意,因为我想要简单一些。该集群处于一个我无法改变的给定配置中,这样一个集成python + qsub的解决方案肯定会使社区受益。 为了简化问题,我有一个简单的函数,例如: im

    5热度

    2回答

    如果我需要“并行”运行很多串行程序(因为问题很简单但很耗时 - 我需要为同一个程序读取许多不同的数据集),如果我只使用一个节点,则解决方案很简单:。我所做的只是在每个命令之后继续提交带有&符号的串行作业,例如在作业脚本中: ./program1 & ./program2 & ./program3 & ./program4 这将自然地运行在不同的处理器上的每个串行程序。这适用于登录服务器或

    4热度

    3回答

    我试图在大型计算机集群上运行一段代码以分析数据的不同部分。 我创建了2个循环来将作业分配给不同节点和节点包含的cpu。 我写的分析函数'chnJob()'只需要一个索引来知道需要分析哪部分数据(在这种情况下是shell变量叫'chn')。 循环是这样的: for NODE in $NODES; do # Loop through nodes for job_idx in {1..$PRO