2011-12-12 39 views
0

因为我看到hadoop的最新稳定版本是0.20.x.最新版本是0.23。 。似乎有很多来自.20的chanages。至0.23.x.Hadoop集群设置0.23版本(MRv2或NextGen MR)

我们能够建立稳定的小群(0.20.2)和实践mapreduce编程。

我们已经看到很多新的API在0.23.x中加入。为了探索0.23.x,我们需要设置0.23.x版本的集群。

难道你们可以给我们一个文档,我们可以在这里设置0.23.x版本的集群。

似乎0.23.x是完全不同的它不像0.20.x当我解压tar文件。请给我们一些从开始提到集群设置的图书参考/ doc。

感谢 MRK

+3

接受一些答案,我们会给你一些链接... –

+1

我知道,大家都在忙,甚至别人给你的查询作出响应。但是,我认为应该有一个最小尝试(我不说花一个小时)来确保查询标题和实际查询被正确书写和格式化。这会告诉其他人你花了一些时间和精力来询问查询,并让他们觉得要回复一个答案。此外,正如托马斯所说,如果你觉得答案是正确的,并且接受它,你会得到更好的答案。社区就像一条双向线路,你参与得越多,你就会得到更多的回应。只是我的2c。 –

+0

谢谢。我去做。 – MRK

回答

2

0.23和预发行0.23之间的主要区别是,在0.23资源管理和应用程序生命周期管理已经分开。 0.23之前只允许运行MapReduce应用程序,但0.23允许除MapReduce以外的其他应用程序。已经有Hama,Giraph和其他一些应用程序被移植并正在移植MPI。

我们已经看到很多新的API在0.23.x中加入。为了探索0.23.x,我们需要设置0.23.x版本的集群。

用户API没有任何差异,因此现有应用程序应该在没有任何代码更改的情况下运行,但需要更改配置文件。从API角度来看,0.23版本是向后兼容的。

这里是MRv2架构,视频,文章等的综合列表。我会尽量让他们更新,因为我遇到新的信息。

http://www.thecloudavenue.com/p/mrv2resources.html