2014-03-12 49 views
2

我想编排我的EMR作业。所以我认为oozie会很合适。我在Oozie工作流程上做了一些POC,但是在本地模式下,它非常简单而且非常棒。如何在EMR集群中运行/安装oozie

但我不明白如何在EMR集群上使用oozie。 基于一些搜索,我知道aws并不是随oozie一起提供的,所以我们已经明确地将它安装为bootstrap动作。 大多数人访问此链接 https://github.com/lila/emr-oozie-sample

但因为我是新来的AWS(EMR),我仍然感到困惑如何使用它。 这将是伟大的,如果任何人都可以简化它为我提供一些步骤或东西。

感谢

回答

0

这GitHub的项目安装了Oozie为好,这样你就不需要照顾它。对于Oozie的安装配置是下一个环节:

https://github.com/lila/emr-oozie-sample/blob/master/config/config-oozie.sh

之后,有一个你可以在命令行执行一些任务: 创建: SSH: sshproxy: socksproxy:

因此,如果你遵循他的指示,你只需要运行一些这些任务来创建和执行一个使用Oozie的EMR任务。

0

首先,这不是一个直接的答案这个问题。

EMR集成了数据管道 - 亚马逊自己的调度程序和数据工作流程编排器。亚马逊希望您使用带有EMR的数据管道。它可以创建,启动和终止EMR集群,管理集群生命周期等。评估以查看是否更适合您的需求。

2

我有一些问题,我发布到AWS技术支持,我得到了下面的答复。我试了一下,Oozie全部安装并运行,不需要额外的努力。

为了在EMR集群上安装Oozie,您需要安装Hue。原因是目前在EMR上的Oozie被安装为Hue的依赖项。根据http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/ami-versions-supported.html,AMI 3.3.0和3.3.1支持色相。启动安装了Hue - >http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-hue.html的EMR集群后,您应该能够立即使用Oozie,因为它已经被配置并启动。