2015-10-15 31 views
2

当我运行QUORUM = 2的3个mesos-master时,它们在被选为领导者后1分钟失败,给出错误:Mesos-master:在fd = 25时关闭失败:传输端点没有连接[107]

E1015 11:50:35.539562 19150 socket.hpp:174] Shutdown failed on fd=25: Transport endpoint is not connected [107] 

E1015 11:50:35.539897 19150 socket.hpp:174] Shutdown failed on fd=24: Transport endpoint is not connected [107] 

他们不断在一个循环中相互选举,一直失败并重新选举。

如果我设置QUORUM = 1,那么一切正常。这可能是什么原因?

+0

你的一个发送电子邮件至mesos邮件列表?它已经解决了? – haosdent

+0

是的,就是我。一个问题是防火墙阻止访问服务器的公共IP,zookeeper正在广播公共IP(在advertise_ip中设置),因此没有人能够互相连接。奴隶也不能连接到主人与相同的错误。 当我删除防火墙规则并将本地IP设置为advertise_ip时,从站可能发生连接。但是还没有尝试QUORUM = 2。 – aladagemre

+0

听起来不错,如果你能最终解决问题或遇到新问题,也请将它发送到邮件列表。以便其他人也可以从你的案例中学习。谢谢。 :-) – haosdent

回答

1

一个问题是AWS防火墙阻止访问服务器的公共IP,zookeeper正在广播公共IP(在advertise_ip中设置),因此没有人能够互相连接。奴隶也无法连接到相同错误的主人。

当我将本地IP设置为advertise_ip(以便Zookeeper广播本地IP)时,主设备可以进行通信并且QUORUM = 2工作。当我删除防火墙规则时,从站可以连接到主站。

0

我们有同样的问题,与像消息mesos-主日志驱:

mesos主[27499]:E0616 14:29:39.310302 27523 socket.hpp:174]关机失败上FD = 67 :运输端点没有连接[107]

原来这是负载均衡器的健康检查,以/stats.json

相关问题