我有一个运行Hadoop 2.6的hadoop群集。我想同时提交多个作业。我想知道是否应该简单地提交多个作业,并让群集处理其余作业,或者我应该将它们作为纱线应用程序编写。事实上,我对Yarn应用程序开发并不十分熟悉,并且确切知道它与常规Hadoop应用程序的不同之处。如何将多个作业提交到hadoop群集
0
A
回答
0
您可以使用正在分叉的mapreduce作业定义oozie工作流程。以下是来自apache oozie文档的示例。
<workflow-app name="sample-wf" xmlns="uri:oozie:workflow:0.1">
...
<fork name="forking">
<path start="firstparalleljob"/>
<path start="secondparalleljob"/>
</fork>
<action name="firstparallejob">
<map-reduce>
<job-tracker>foo:9001</job-tracker>
<name-node>bar:9000</name-node>
<job-xml>job1.xml</job-xml>
</map-reduce>
<ok to="joining"/>
<error to="kill"/>
</action>
<action name="secondparalleljob">
<map-reduce>
<job-tracker>foo:9001</job-tracker>
<name-node>bar:9000</name-node>
<job-xml>job2.xml</job-xml>
</map-reduce>
<ok to="joining"/>
<error to="kill"/>
</action>
<join name="joining" to="nextaction"/>
...
</workflow-app>
+0
谢谢,那是我最初的想法。但纱线呢?我可以将它们作为纱线应用程序提交吗?他会有什么不同? –
1
您可以使用MR1和YARN运行MR作业。 YARN has nothing to do with job parallelism.
这只是一个运行各种工作的框架。
使用oozie工作流或shell脚本并行运行作业。
相关问题
- 1. 如何从Web应用程序提交作业到hadoop群集?
- 2. 如何将Flink作业提交到远程YARN集群?
- 3. 如何从另一个hadoop作业提交hadoop作业
- 4. 通过socks代理将YARN作业提交到远程Hadoop集群
- 5. 使用AWS Hadoop集群设置的Spark作业提交
- 6. 提交Hadoop作业
- 7. Git将多个提交集群集合成一个提交
- 8. 在lsf集群上提交mpi作业
- 9. 使用'-py-files'参数将PySpark作业提交到群集
- 10. 使用MRJob将作业提交到EMR集群
- 11. 如何强制condor将作业提交到集群中的所有节点?
- 12. 如何将Sqoop连接到多个hadoop群集
- 13. 如何从Java向远程YARN集群提交级联作业?
- 14. 如何正确提交火花的作业单机集群
- 15. Hadoop和多个集群
- 16. 整合多个Hadoop集群
- 17. nohup命令将作业提交给集群
- 18. 无法提交从Windows IDE到Linux集群的Spark作业
- 19. 如何在作业提交前将jar分发给hadoop
- 20. 如何使用ResourceManager HA和Hortowork的HDP将MR作业提交给YARN群集?
- 21. Hadoop集群工作
- 22. 在Amazon EC2上运行hadoop作业:多节点群集
- 23. 链接多个hadoop作业,无需等待提交
- 24. 有没有一种使用bash将作业提交到集群的好方法?
- 25. Hadoop HDInsight .NET SDK API提交作业
- 26. 如何管理配置以连接到多个Hadoop集群?
- 27. 如何将一个Hadoop集群中的数据复制到另一个Hadoop集群?
- 28. 将Hadoop配置为多节点群集
- 29. Hadoop多节点群集
- 30. Hadoop多主集群设置
你需要执行哪种工作? Mapreduce,Hive等? – InfamousCoconut
他们只是mapreduce工作 –