2015-02-04 28 views
0

我使用的是中间层3主机上了Ubuntu的14.04如下恢复工作正常,但在重新启动所有物理主机后,所有预定作业都会丢失。 这很正常吗?我期望动物园管理员将存储当前作业,然后当系统需要重新启动时,所有作业将在主引导后重新计划。Mesos集群不物理主机时重启

更新: 我使用的是同一个节点上马拉松和mesos,而我与运行标志--zk

+0

您正在使用什么调度程序? – KirkSpaziani

+0

@KirkSpaziani,我正在使用马拉松 – kikicarbonell

+0

你能检查动物园管理员的状态吗? – drexin

回答

0

马拉松马拉松的--zk并启用--ha,马拉松应存储其ZK中的状态并在重新启动时恢复它,只要Mesos允许它使用相同的框架ID重新注册。

但是,您还需要启用Mesos注册表(即使对于单个主服务器),以确保Mesos在主服务器故障转移的情况下持久保存有关注册了哪些frameworkIds的信息。这可以通过设置--registry=replicated_log(默认),--quorum=1(因为您只有1个主设备)和--work_dir=/path/to/registry(存储状态的位置)来完成。

0

虽然你找到了解决办法,我想更多地解释这个问题:)

在官方文档:http://mesos.apache.org/documentation/latest/slave-recovery/

请注意,如果从属设备上的操作系统重新启动,则主机运行的所有 执行程序和任务都会被终止,而不会在主机恢复时自动重新启动 。

所以Mesos上的所有框架在重启后都会被终止。重新启动框架的一种方式是运行Marathon上的所有框架,这将管理其他框架并重新启动它们。

但是,您需要在死亡时自动重新启动Marathon。在你提到的数字海洋链接中,Marathon在init.d中安装了脚本,因此它可以在重新启动后重新启动。否则,如果您通过源代码安装Marathon,则可以使用supervisord等工具来监控Marathon。