2
当我运行mapreduce时,我得到的结合输入记录大于地图输出记录吗?这真的很奇怪。我无法弄清楚到底发生了什么?据我所知,地图输出记录应该是相同的广告组合输入记录。任何人都可以请帮我找出问题。提前致谢。地图输出记录的数量少于合并hadoop中的输入记录
这是一个现实世界的工作例如:
Map-Reduce Framework
Map input records=112705844
Map output records=64841776
Combine input records=64842079
Combine output records=409
Reduce input records=106
Reduce output records=4