阅读关于MapReduce的论文,并提到将所有中间键分组在一起。在MapReduce中,如何在多台机器上执行相同的reduce任务?
当减少工作人员已读取所有 中间数据时,它使所有的 出现相同的密钥的被组合在一起通过中间键进行排序。排序是 需要,因为通常很多不同的键映射到相同的减少 任务。如果中间数据量太大,无法在 存储器,外部排序是使用
有没有相同的reduce任务提到在多台机器被exectued。
当reduce任务完成时,reduce worker会自动将其临时输出文件重命名为最终输出文件。如果在多台机器上执行相同的减少 任务,则会为相同的最终输出文件执行多个重命名调用 。
如果将相同的键组合在一起,是不是会成为一个减少工作人员运行的减少任务?同一个reduce任务如何在多台机器上运行?
Same Reduce任务可以在多台机器上运行。 –