2

我正在运行EMR群集并尝试使用Zeppelin笔记本进行数据分析。如何让Zeppelin在EMR集群上干净地重新启动?

版本: 防粘标签:EMR-5.2.1
Hadoop发行版:亚马逊2.7.3
蜂巢2.1.0
星火2.0.2
齐柏林0.6.2

我一直有在运行查询时Zeppelin挂起时出现问题,我无法恢复。我曾尝试:
- 重启解释
- SSH'ing到主节点和运行zeppelin_daemon.sh restart(试图运行的的hadoop /根/飞艇,并且还与选项reloadstart/stop运行脚本,upstart

我每次使用后台驻留程序的shell脚本,它告诉我,它已停止/启动正常,但后来我得到这个,当我运行状态:
Zeppelin running but process is dead [FAILED]

,我似乎可以做的唯一的事情就是杀我的集群,并站起来一个新的,这在许多层面上疯狂。

那么......正式支持的重启Zeppelin的方法是什么?

+0

你解决了吗? – Davos

回答

3

EMR上的服务使用upstart,支持的方式是使用“sudo stop < service-name>; sudo start < service-name>”。 (启动和停止命令位于/ sbin中,默认情况下位于PATH中。)

注意:目前在EMR上有一个限制,可以防止/ sbin/restart工作正常,所以您必须先使用stop然后启动而不是重新启动。

+0

我试过这个'sudo/sbin/stop zeppelin',然后'sudo/sbin/start zeppelin',现在网站显示503错误。访问/的问题。原因:服务不可用。 在此之前,我尝试将SIGTERM发送给zeppelin服务的PID。我想知道EMR用来运行新贵的实际命令,可能不仅仅是'开始zeppelin' – Davos

+1

你得到503错误(而不是连接错误)的事实意味着Zeppelin必须运行,但显然由于某种原因不起作用。您可以查看/ var/log/zeppelin中的日志以获取线索。顺便说一下,EMR运行的守护进程不过是“sudo/sbin/start ”。 –

0

这可能听起来有点傻,我不确定它为什么起作用。但是,我在发出守护进程停止/启动并使其工作时遇到了问题。但是如果我可以让守护进程运行,启动一个我知道可用的笔记本,然后更换问题笔记本,有时可以修复一个挂起,至少可以恢复我所做的工作。

0

我ssh'ed到主节点,然后紧接着跑

$ sudo stop zeppelin 
zeppelin stop/waiting 

$ sudo start zeppelin 
zeppelin start/running, process 24434 

,刷新齐柏林给了我503,但1〜2分钟左右后,用户界面是再次可用。我检查了/ var/log/zeppelin中的日志,并且需要一些时间来配置设置。

相关问题