我使用的是中间层3主机上了Ubuntu的14.04如下恢复工作正常,但在重新启动所有物理主机后,所有预定作业都会丢失。 这很正常吗?我期望动物园管理员将存储当前作业,然后当系统需要重新启动时,所有作业将在主引导后重新计划。Mesos集群不物理主机时重启
更新: 我使用的是同一个节点上马拉松和mesos,而我与运行标志--zk
我使用的是中间层3主机上了Ubuntu的14.04如下恢复工作正常,但在重新启动所有物理主机后,所有预定作业都会丢失。 这很正常吗?我期望动物园管理员将存储当前作业,然后当系统需要重新启动时,所有作业将在主引导后重新计划。Mesos集群不物理主机时重启
更新: 我使用的是同一个节点上马拉松和mesos,而我与运行标志--zk
马拉松马拉松的--zk
并启用--ha
,马拉松应存储其ZK中的状态并在重新启动时恢复它,只要Mesos允许它使用相同的框架ID重新注册。
但是,您还需要启用Mesos注册表(即使对于单个主服务器),以确保Mesos在主服务器故障转移的情况下持久保存有关注册了哪些frameworkIds的信息。这可以通过设置--registry=replicated_log
(默认),--quorum=1
(因为您只有1个主设备)和--work_dir=/path/to/registry
(存储状态的位置)来完成。
虽然你找到了解决办法,我想更多地解释这个问题:)
在官方文档:http://mesos.apache.org/documentation/latest/slave-recovery/
请注意,如果从属设备上的操作系统重新启动,则主机运行的所有 执行程序和任务都会被终止,而不会在主机恢复时自动重新启动 。
所以Mesos上的所有框架在重启后都会被终止。重新启动框架的一种方式是运行Marathon上的所有框架,这将管理其他框架并重新启动它们。
但是,您需要在死亡时自动重新启动Marathon。在你提到的数字海洋链接中,Marathon在init.d中安装了脚本,因此它可以在重新启动后重新启动。否则,如果您通过源代码安装Marathon,则可以使用supervisord等工具来监控Marathon。
您正在使用什么调度程序? – KirkSpaziani
@KirkSpaziani,我正在使用马拉松 – kikicarbonell
你能检查动物园管理员的状态吗? – drexin