3
我正在EMR上创建集群并将Zeppelin配置为从S3读取笔记本。要做到这一点,我使用JSON对象,看起来像:在启动集群时在EMR上配置Zeppelin的Spark解释器
[
{
"Classification": "zeppelin-env",
"Properties": {
},
"Configurations": [
{
"Classification": "export",
"Properties": {
"ZEPPELIN_NOTEBOOK_STORAGE":"org.apache.zeppelin.notebook.repo.S3NotebookRepo",
"ZEPPELIN_NOTEBOOK_S3_BUCKET":"hs-zeppelin-notebooks",
"ZEPPELIN_NOTEBOOK_USER":"user"
},
"Configurations": [
]
}
]
}
]
我粘贴此对象EMR的Stoftware配置页: 我的问题是,如何/我在哪里可以配置星火解释直接在每次启动集群时无需从Zeppelin手动配置它?
非常感谢@ rdeboo。你能否详细说明什么是“2ANGGHHMQ”。你能否提供一个设置“spark.yarn.executor.memoryOverhead”为2048的例子,这是我的情况以及spark.executor.memory和spark.executor.cores – Rami
@Rami这是一些内部密钥名称,用于标识相关部分在interpreter.json中。看起来很稳定(我看过很多不同版本的EMR实例)。但是当然不能保证这不会改变。无论如何,我认为AWS应该修复默认配置,以便我们都可以停止使用此解决方法。 – rdeboo
这是伟大的工作!但在我的情况下需要一个关键的调整。使用其余API重新启动解释器似乎没有在interpreter.json中选择任何更改。 Zeppelin本身需要重新启动,至少这发生在EMR上。所以,而不是卷曲它的工作:sudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh重新启动 –