在Hadoop MapReduce中,中间输出(地图输出)保存在本地磁盘中。我想知道是否可以在reduce阶段开始一项工作,从本地磁盘读取mapoutput,对数据进行分区并执行reduce任务?仅仅是减速阶段的工作?
0
A
回答
3
Mapper的一个基本实现叫做IdentityMapper,它基本上将所有的键值对传递给一个Reducer。
- Reducer将由不同映射器生成的输出作为pair读取并发出键值对。
- Reducer的工作是处理来自映射器的数据。
- 如果MapReduce程序员不使用JobConf.setMapperClass设置Mapper类,那么IdentityMapper.class被用作默认值。
你不能只运行异径没有任何映射器..
0
映射reduce对HDFS中的数据起作用。所以我不认为你可以写Reducer only map reduce从本地磁盘读取
0
如果你使用Hadoop的数据流,你可以添加:
-mapper "/bin/sh -c \"cat\""
相关问题
- 1. 如何在缩减阶段工作时启动映射阶段
- 2. log4j等日志工具是否仅在开发阶段有用?
- 3. Jenkins管道 - 仅在最后阶段合并的并行阶段
- 4. 减速机阶段完全没有启动。它总是'减速机= 0%'
- 5. Gestouch仅适用于映射到阶段
- 6. jQuery:函数是如何工作的仅仅是点(。)
- 7. 不工作的使用仅仅是的FilePermission
- 8. Kohana的2 - force_login不仅仅是如下工作
- 9. 仅仅是我...还是仅仅是PHP的“Facebook Mobile Web”?
- 10. 复制范围从多个工作表而不是仅仅一个工作表
- 11. Excel VBA,更新特定工作表,不仅仅是活动工作表
- 12. AngularJS日期验证不仅仅是第一次工作
- 13. 转型Firefox或Opera不工作,不仅仅是Chrome
- 14. 此代码是否工作通用,还是仅仅是我的系统?
- 15. 仅查询工作的phpMyAdmin
- 16. 减少HTML文件大小 - 不仅仅是最小化?
- 17. 如何添加/减去值而不仅仅是该值
- 18. 写作不仅仅是“你好”
- 19. 制作制表不仅仅是空白
- 20. 减速机停止工作
- 21. 高阶减速机应用于多个减速机
- 22. dmDeviceName仅仅是“C”
- 23. 不仅仅是EXC_BAD_ACCESS?
- 24. 仅在虚拟仿真器中工作的Android加速度计
- 25. 如何跟踪开发后需要移动到下一个阶段的项目(而不仅仅是代码)?
- 26. Q;闪存仅适用于Mac的FileReference阶段更新BUG
- 27. GIT中:仅阶段修改的文件,而不是增加或删除的
- 28. mLayout.addView()仅工作一次
- 29. CSS仅与PHP API工作
- 30. 仅从根开始工作
我无法找到身份映射器的任何实例。我使用了Google,或者使用github。你能指点我吗? – xeon