如果存在仅包含映射且没有reduce的作业,并且要处理的所有数据值都映射到单个键,那么该作业是否只能在单个节点上处理?Hadoop映射进程
0
A
回答
0
直接来自Hadoop权威指南,第6章剖析Map减少作业运行。
“创建任务运行列表中,作业调度器首先检索 从共享文件系统由客户端计算的输入分裂。它 然后为每个分割创建一个地图的任务。reduce任务的数量 创建的数据由 作业中的mapred.reduce.tasks属性确定,该作业由setNumReduceTasks()方法设置,而调度程序 仅创建此数量的要执行的reduce任务,任务给出为 此处的ID点。”
1
第 基本上,节点的数量将由映射器的数量决定。 1个映射器将在1个节点上运行,N个节点上映射N个映射器,每个映射器有一个节点。 您的工作所需的映射器数量将由Hadoop设置,具体取决于数据量以及您的数据将被拆分的块的大小。每个数据块将由1个映射器处理。 因此,例如,如果您有大量的数据,将其分成N个块,则需要N个映射器来处理它。
相关问题
- 1. Hadoop:映射二进制文件
- 2. Hadoop递归映射
- 3. 进程间映射与映射/ unordered_map
- 4. 的Hadoop的map-reduce映射编程
- 5. Hadoop无法找到映射程序
- 6. Hadoop - 文件到块映射
- 7. Hadoop的流单映射
- 8. Hadoop的许多映射器
- 9. hadoop过滤映射输出
- 10. Hadoop未找到映射类
- 11. Hadoop几个映射器
- 12. HADOOP:从映射器发射矩阵
- 13. Hadoop日志键是否映射到reducer映射?
- 14. 使用二进制数据级联hadoop流式映射还原
- 15. 使用Hadoop通过两个数据集进行映射
- 16. Hadoop Streaming:映射器'包装'二进制可执行文件
- 17. Hadoop中的映射器数量
- 18. Hadoop排序映射并减少键值
- 19. Hadoop的映射器运行缓慢
- 20. hadoop映射器静态初始化
- 21. 由于ConnectException,Hadoop映射失败
- 22. 我如何开始为Hadoop映射?
- 23. HADOOP - 获取映射器内的nodename
- 24. Hadoop术语映射到硬件
- 25. Hadoop流式缩减器映射器
- 26. Tuple作为Hadoop映射器中的键
- 27. 分离Hadoop映射并减少任务
- 28. hadoop mapreduce只执行一个映射器
- 29. awk不Hadoop中的映射工作
- 30. hadoop设置方法映射器
正确,但许多映射器可以在同一个节点上运行(可配置的编号) – vefthym