无法启动Mesos /马拉松集群

物理机：192.168.10.1（Mesos，动物园管理员，马拉松）
虚拟机：192.168.122.10（Mesos，动物园管理员）
虚拟机：192.168.122.46（Mesos，动物园管理员）无法启动Mesos /马拉松集群

所有三台机器的操作系统都是Fedora 23服务器

默认情况下，两个网络已经路由，因为虚拟机都驻留在物理机器上。

没有防火墙设置。

Mesos选举LOG：

Master bound to loopback interface! Cannot communicate with remote schedulers or slaves. You might want to set '--ip' flag to a routable IP address.

我可以手动设置这个，但是我不能设置动态...的--ip_discovery_command标志不被认可。

我想要做的就是将下面的脚本链接到该标志。

if [[ $(ip addr) == *enp8s0* ]]; 
then 
    ip addr show enp8s0 | awk -F'/| ' '/inet/ { print $6 }' 
else 
    ip addr show eth0 | awk -F'/| ' '/inet/ { print $6 }' 
fi

当我手动设置此（不是我想要做的）...

在IP:5050的Mesos页面出现......但随后的mesos主1分钟后因失败这...

F0427 17:03:27.975260 6914 master.cpp:1253] Recovery failed: Failed to recover registrar: Failed to perform fetch within 1mins 
*** Check failure stack trace: *** 
    @  0x7f8360fa9edd (unknown) 
    @  0x7f8360fabc50 (unknown) 
    @  0x7f8360fa9ad3 (unknown) 
    @  0x7f8360fac61e (unknown) 
    @  0x7f83619a85dd (unknown) 
    @  0x7f83619e7c30 (unknown) 
    @  0x55a885ee3b2e (unknown) 
    @  0x7f8361a11c0e (unknown) 
    @  0x7f8361a5d75e (unknown) 
    @  0x7f8361a7077a (unknown) 
    @  0x7f83618f4aae (unknown) 
    @  0x7f8361a70768 (unknown) 
    @  0x7f8361a548d0 (unknown) 
    @  0x7f8361fc832c (unknown) 
    @  0x7f8361fd42a5 (unknown) 
    @  0x7f8361fd472f (unknown) 
    @  0x7f8360a5e60a start_thread 
    @  0x7f835fefda4d __clone Aborted (core dumped)

动物园管理员设置是这样的：

# The number of milliseconds of each tick 
tickTime=2000 
# The number of ticks that the initial 
# synchronization phase can take 
initLimit=10 
# The number of ticks that can pass between 
# sending a request and getting an acknowledgement 
syncLimit=5 
# the directory where the snapshot is stored. 
# do not use /tmp for storage, /tmp here is just 
# example sakes. 
dataDir=/var/lib/zookeeper/data 
dataLogDir=/var/lib/zookeeper/log 
# the port at which the clients will connect 
clientPort=2181 
# the maximum number of client connections. 
# increase this if you need to handle more clients 
#maxClientCnxns=60 
# 
# Be sure to read the maintenance section of the 
# administrator guide before turning on autopurge. 
# 
# http://zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance 
# 
# The number of snapshots to retain in dataDir 
#autopurge.snapRetainCount=3 
# Purge task interval in hours 
# Set to "0" to disable auto purge feature 
#autopurge.purgeInterval=1 
server.1:192.168.10.1:2888:3888 
server.2:192.168.122.46:2888:3888 
server.3:192.168.122.10:2888:3888

，而且不知道如何VERI因为它正在正常工作...

我老实说在我的绳索末端..在过去的一周拉出我的头发在这个由于糟糕的文件和缺乏适当的架构解释（主要是马拉松）可怕的有组织的日志（Mesos），systemd无法正确解析bash并将输出用作变量，并且缺少周围的指示。

我做错了什么？我赞赏我能得到的任何帮助，让我知道如果您需要我还没有提供的任何东西，我会马上发布。

编辑：

我固定的问题与马拉松，通过增加两个额外的马拉松服务器到虚拟机的，这样他们可以组成一个法定人数。

EDIT2：

我现在有在Mesos服务器保持快速重新选举的领导者的问题......但根据结果我会考虑稍后...

来源

2016-04-27 Procyclinsur

如果你密切关注installation docs，我认为你应该得到它的工作。

例如你“主绑定到回送”的问题是恕我直言关系到不正确的/不完整的设置。请参阅：

主机名（可选）

如果您无法直接解决了机器的主机名（例如，如果在不同的网络或使用VPN），设置/etc/mesos-master/hostname的值您可以解析，例如，可从外部访问的IP地址或DNS主机名。这将确保Mesos控制台的所有链接正常工作。

您还可以在/etc/marathon/conf/hostname中设置此属性。

此外，我建议还要在/etc/mesos-master/ip文件中设置主IP地址。务必确保主机名可解析为非本地IP地址，即通过在每台主机上的/etc/hosts文件中添加条目。

基本上，/etc/hosts文件应该类似于此（替换为实际的主机名）：

127.0.0.1 localhost 

192.168.10.1 host1 
192.168.122.10 host2 
192.168.122.46 host3

如果你只是想测试Mesos集群，你也可以使用预配置的流浪解决方案一样tobilg/coreos-mesos-cluster。

关于ZooKeeper设置，请确保您在包含您为每个节点设置的实际数字ID的每个节点上创建/var/lib/zookeeper/myid，例如，对于192.168.10.1该文件的唯一内容需要为1。

在调试主设备之前，请检查ZooKeeper集群是否正常工作，并选择了一名主管。确保/etc/mesos/zk在每个主机上包含正确的ZooKeeper连接字符串，例如

zk://192.168.10.1:2181,192.168.122.10:2181,192.168.122.46:2181/mesos

如果ZK工作，然后重新启动服务并检查主日志。对奴隶做同样的事情。

参考文献：

来源

2016-04-27 09:48:51 Tobi

只要稍微抬头@tobi：open.mesosphere.com已被弃用，并且将很快消失，可能不想用它作为参考，向前;） –

@MichaelHausenblas谢谢你的提醒。这将是很好，如果这将在页面上的某个地方说明。我可以使用提供的可用链接配置不同操作系统的集群，因此看起来它们仍然正确（说到最新的Mesos版本）。 – Tobi

我的安装没有/ etc/mesos和/ etc/mesos-master或/ etc/zookeeper/conf /目录...我不知道它是否会读取它们...好消息是我的动物园管理员运行得很好。我试图创建它们，看看它是如何发展。 – Procyclinsur

无法启动Mesos /马拉松集群

回答

相关问题