2017-08-02 72 views
1

我想在Ubuntu 14.04上的一台服务器( - >一个节点,服务器本身)上配置Torque v6.1.1.1。 我使用defauts参数(configure)进行安装。在构建包之后,我安装了这些模块:服务器,客户端和妈妈。 我配置是这样的:扭矩单节点,不匹配协议

  • server_priv /节点

hostname

  • 服务器名

hostname

  • mom_priv /配置

$pbsserver hostname $logevent 20

我从mom_log此错误:

LOG_ERROR::read_tcp_reply, Mismatching protocols. Expected protocol 4 but read reply for 0 

从server_log

LOG_ERROR::tcp_connect_sockaddr, Failed when trying to open tcp connection - connect() failed [rc = -2] [addr = 127.0.1.1:15003] 

我试图severals的东西,如:给了妈妈一个名字在配置文件中,并将此名称添加到/ etc/hosts中,并将其替换为hostname本地主机没有结果。

我该如何解决它? 非常感谢

回答

0

Tkanks了很多,我解决了这个问题通过

  • 安装V6.0.1

  • 运行./torque.setup localhost root

  • server_priv /节点:localhost

  • mom_priv /配置:$pbsserver <hostname>$mom_host localhost

  • 服务器名称:<hostname>

0

我建议杀死pbs_serverpbs_mom进程,然后重新启动它们。您可以分别使用pbsnodesmomctl -d0进行检查。

+0

我有此与pbsnodes'的ubuntu 状态=向下 power_state =运行 NP = 1个 n-型=簇 mom_service_port = 15002 mom_manager_port = 15003 '和这与momctl -d0'主机:ubuntu/ubuntu版本:6.1.1.1 PID:189950 服务器[0]:ubuntu(127.0.1。1:15001) 警告:发送到服务器中没有消息 homeDirectory的:从服务器 警告没有接收到消息的/ var /阀芯/扭矩/ mom_priv MOM活性:16秒 LogLevel的:100(使用SIGUSR1/SIGUSR2调整) 注意:没有检测到本地作业 诊断完成 '它' – user7378541

+0

如果'hostname'和'hostname -f'没有返回相同的输出,那么您需要将它们都停止('qterm'&'momctl -s' ),将长名称放入server_name文件中,注释'$ pbsserver'行,然后开始一切备份。 – clusterdude

+0

或者,您可以将主机名设置为短名称。这需要1)更新'/ etc/hostname',2)运行'hostname ',3)将短名称条目添加到'/ etc/hosts'中。 (它可能还需要重新启动'pbs_server'和'pbs_mom'服务。( – clusterdude