我在Hadoop的新的,我有一个程序工作的那个地图功能的输入是一个文件,关键是这样的:重点重新编号减少
ID: value:
3 sd
37 g
5675 gk
68 oi
我的文件大约10千兆字节,我想要更改这些ID并按降序重新编号。我不想改变这些值。 我的输出必须是这样的:
ID: value:
5675 sd
68 g
37 gk
3 oi
我想做这个工作节点的集群?我怎样才能做到这一点?
我认为我需要一个全局变量,我不能在集群中做到这一点?我能做什么?
这是你会做多次的过程?或者这是一笔一笔交易? – greedybuddha 2013-05-07 18:04:31
@greedybuddha:我必须做一次。 – user1878364 2013-05-07 18:18:53