0
Reduce方法处理来自地图的分组数据。但我不知道如何减少任务采取组数据?如果地图输出很多分组数据,那么每个减少任务只读取相同数量的组?什么是机制?hadoop如何减少任务处理地图分组数据
Reduce方法处理来自地图的分组数据。但我不知道如何减少任务采取组数据?如果地图输出很多分组数据,那么每个减少任务只读取相同数量的组?什么是机制?hadoop如何减少任务处理地图分组数据
如何减少任务占用组数据?
据上随机处理,并且排序相
在此phasedData其由映射器发送由密钥(像组由(密钥)),最后它获得密钥,列表<>结果进行分组。结果发送给reducer。如果结果需要发送到不同的减速器,则需要考虑与洗牌和排序阶段不同的阶段。
这个阶段是由Hadoop框架完成的,据我所知你没有任何事情要做或改变这个阶段。
也是我建议看看这个问题What is the purpose of shuffling and sorting phase in the reducer in Map Reduce Programming?