2016-04-14 64 views

回答

0

如何减少任务占用组数据?

据上随机处理,并且排序相

在此phasedData其由映射器发送由密钥(像组由(密钥)),最后它获得密钥,列表<>结果进行分组。结果发送给reducer。如果结果需要发送到不同的减速器,则需要考虑与洗牌和排序阶段不同的阶段。

这个阶段是由Hadoop框架完成的,据我所知你没有任何事情要做或改变这个阶段。

enter image description here

也是我建议看看这个问题What is the purpose of shuffling and sorting phase in the reducer in Map Reduce Programming?