2013-03-21 49 views

回答

0

它实际上不是必须的。使用分布式缓存的主要目的是使资源可用于在整个集群中的所有节点上运行的所有映射器或简化器,这在单台机器上没有太大意义。在单个节点的hadoop集群上,你可以在你的mapreduce代码中拥有一个全局变量,这可以做到这一点。

+0

是否可以在此语句后检查文件是否存在于分布式缓存中 DistributedCache.addCacheFile(new URI(otherArgs [2]),conf); – Lav 2013-03-22 04:51:19