我的团队正在Amazon Cloud上部署新的大数据架构。我们已经启动并运行Spark作业。Spark Mesos Dispatcher
我们从同一集群内的堡垒主机提交Spark作业(即:jars)。但是,这样做,堡垒主机是驱动程序,这称为client mode(如果我理解正确)。
我们想尝试cluster mode,但我们不明白从哪里开始调度程序。
文档说它在集群中启动它,但我很困惑,因为我们的主人没有安装Spark,而且我们使用Zookeeper进行主选。在从属节点上启动它并不是一个可行的选项,因为从属服务器可能会失败,并且我们不希望将一个从属IP或公共DNS暴露给堡垒主机。
在堡垒主机上启动调度程序是否正确?
非常感谢您
你是如何启动调度程序?我的意思是在哪里指定 - 大师mesos:// zk:// ... –
对不起,这是很久以前。我们因为各种原因放弃了Mesos作为资源经理,因此我无法回答或指出您对文档 – besil
非常感谢您抽出宝贵时间发表评论!美好的一天 ! :) –