我是扭矩/ pbs调度程序的新用户,我将它安装在服务器上的一台debian 8计算机上,并使用debian 8在计算节点上的客户机上进行另一次安装。Q队列中的所有作业都用于扭矩Pbs调度程序
在我的服务器我有pbs_server能和pbs_sched运行,有pbs_mom我的计算节点上,每个日志中有任何错误,pbsnode -a似乎不错:
[email protected]:[torque]>pbsnodes -a
debian8s-2
state = free
power_state = Running
np = 4
ntype = cluster
status = rectime=1458048686,macaddr=00:14:5d:0f:8d:08,cpuclock=Fixed,varattr=,jobs=,state=free,netload=109918452,gres=,loadave=0.32,ncpus=4,physmem=16432364kb,availmem=20066372kb,totmem=20337896kb,idletime=13385,nusers=1,nsessions=3,sessions=989 992 998,uname=Linux debian8s-2 3.16.0-4-amd64 #1 SMP Debian 3.16.7-ckt11-1+deb8u4 (2015-09-19) x86_64,opsys=linux
mom_service_port = 15002
mom_manager_port = 15003
我每次提交作业被卡住在问:
[email protected]:[torque]>qstat
Job ID Name User Time Use S Queue
------------------------- ---------------- --------------- -------- - -----
3.debian8s-1 STDIN tototo 0 Q batch
5.debian8s-1 my_job tototo 0 Q batch
6.debian8s-1 STDIN tototo 0 Q batch
7.debian8s-1 STDIN tototo 0 Q batch
8.debian8s-1 STDIN tototo 0 Q batch
我查找文档,但没有找到任何关于这个问题,有没有人有我错过了什么的想法?
谢谢。
首先检查调度程序日志。您可以使用'tracejob 3'或'qstat -f 3'来获取作业#3的信息。使用“qmgr -c打印服务器”打印服务器和队列配置。发布你的发现。 –