1
我正在编写一个mapreduce程序,其中reduce函数接收作为输入值的PageRankNode(具有两个字段)对象的迭代并将它添加到优先级队列中。在遍历每个对象并将其添加到优先级队列时,结果优先级队列只包含我添加的最后一个对象。 但是,当我创建一个相同类型的新对象并添加到优先级队列中时,它似乎能够按预期工作。优先级队列添加新对象vs添加已创建
我想知道为什么会发生这种情况? 下面的示例作品。然而,而不是“topPages.add(新PageRankNode(pageNode.pageName,pageNode.pageRank))”,我使用“topPages.add(pageNode)”它不按预期工作。
下面还添加了优先级队列的比较器实现。
private Comparator<PageRankNode> comparator= new PageNodeComparator();
private PriorityQueue<PageRankNode> topPages= new PriorityQueue<PageRankNode>(100,comparator);
public void reduce(NullWritable key,Iterable<PageRankNode> pageNodes,Context context) throws IOException,InterruptedException{
for(PageRankNode pageNode:pageNodes){
//topPages.add(pageNode);
topPages.add(new PageRankNode(pageNode.pageName,pageNode.pageRank));
if(topPages.size()>100){
topPages.poll();
}
}
PageRankNode pageNode;
while(!topPages.isEmpty()){
pageNode=topPages.poll();
context.write(NullWritable.get(),new Text(pageNode.pageName+":"+pageNode.pageRank));
}
}
public class PageNodeComparator implements Comparator<PageRankNode>{
public int compare(PageRankNode x,PageRankNode y){
if(x.pageRank < y.pageRank){
return -1;
}
if(x.pageRank > y.pageRank){
return 1;
}
return 0;
}
}