我可以编写只有Mappers和组合器(即没有减速器的迷你减速器)的Hadoop代码吗?Hadoop中没有减速器的组合器
job.setMapperClass(WordCountMapper.class);
job.setCombinerClass(WordCountReducer.class);conf.setInt(“mapred.reduce.tasks”,0);
我试图这样做,但我总能看到,我有一个减少作业服务器链接
推出reduce任务在任务= 1个
如何删除减速而保持合成器?那可能吗?
哦,非常感谢,这绝对可以解决我的问题:) –
使用自定义分区(比如身份)和使用主机名称作为关键字会更好吗?这应该使洗牌微不足道,这比从@ Evgeny的聪明的技巧 –
出现的完整洗牌快。是的,这也应该工作:)但是什么意思是“完全洗牌”? –