2015-11-24 38 views
1

我们有非常复杂的管道,我们需要编写和安排。我看到Hadoop生态系统为此提供了Oozie。当我在Mesos或Standalone上运行Spark并且没有Hadoop集群时,基于Spark的作业有哪些选择?什么是oozie等同于Spark?

回答

0

与使用Hadoop,它是很容易的事情连锁星火。所以编写一个Spark Scala脚本可能就足够了。我的第一个建议是绑定。

如果你想保持它像SQL一样,你可以试试SparkSQL。

如果你有一个非常复杂的流程,那么值得看一下Google数据流https://github.com/GoogleCloudPlatform/DataflowJavaSDK

0

Oozie可以用于纱线的情况下, 对于spark没有内置的调度程序可用,因此您可以自由选择任何在集群模式下工作的调度程序。

对于Mesos我觉得Chronos的将是正确的选择,更多信息的Chronos

相关问题