仅仅是减速阶段的工作？

在Hadoop MapReduce中，中间输出（地图输出）保存在本地磁盘中。我想知道是否可以在reduce阶段开始一项工作，从本地磁盘读取mapoutput，对数据进行分区并执行reduce任务？仅仅是减速阶段的工作？

2015-11-10 xeon123

Mapper的一个基本实现叫做IdentityMapper，它基本上将所有的键值对传递给一个Reducer。

你不能只运行异径没有任何映射器..

2015-11-10 19:56:26 hadooper

我无法找到身份映射器的任何实例。我使用了Google，或者使用github。你能指点我吗？ – xeon

映射reduce对HDFS中的数据起作用。所以我不认为你可以写Reducer only map reduce从本地磁盘读取

2015-11-10 18:15:27 Ramzy

如果你使用Hadoop的数据流，你可以添加：

-mapper "/bin/sh -c \"cat\""

2017-04-21 15:04:27

回答