hadoop减少拆分大小

我有一个使用少量数据（200 MB）的Mapreduce作业。地图阶段计算简单，但缩小阶段的计算量很大，需要花费更多的时间来分析一个输入。给定32 MB的分割大小，我发现在映射阶段所有机器都在计算，但在缩小阶段只有一个是，而缩小阶段要慢得多。有没有一种方法可以使分割更小，仅用于缩小作业阶段，以便我可以将所有机器用于缩小阶段？hadoop减少拆分大小

来源

2016-06-29 user4052054

您的制图人员制作了多少个关键组？ –

@BinaryNerd我怎么知道？ – user4052054

看看你的工作柜台，它是一个标准柜台。你也应该知道你的关键是什么，以及你期望它的粒度。例如，如果您有一个键，则只会运行一个缩减器。 –