2011-11-04 135 views
10

我一直听到很多关于Apache Hadoop的信息,这是一种处理密集型服务的好方法。寻找Hadoop的基本介绍。像helloworld等效,然后可能是一个示例用例。Hadoop Hello World示例和简介

回答

10

字计数示例代码是如此简单,任何人都可以新理解it.It有

https://hadoop.apache.org/docs/r1.2.1/mapred_tutorial.html#Example:+WordCount+v2.0

与将所有的haddop阿比前刚刚编译:Hadoop的core.jar添加 创建。通过netbin的jar文件,当它与cmd中的hadoop一起运行时会感到惊讶。

如果你想要一个又一个,我已经做了须藤索引......像

Cow 2.txt 3.txt 4.txt 
Cat 1.txt 

etc. 

就问我,我会给你这是这么simple.But我建议你应该运行此示例代码第一。

现在,我还以为你已经完成了前一个任务,所以这里是用>> http://matrixsust.blogspot.com/2011/11/hadoop-simple-indexer-in-map-reduce.html

希望它可以帮助的链接。

+1

该链接404'd,因为它似乎是最重要的结果之一,我认为将更新的链接是好的。 – Acapulco

+1

我已经更新了链接并加上提醒;) –

3

在进入Hadoop之前,需要了解MapReduce(Hadoop基于MapReduce)。以下是MapReduce上的一些不错的videos。在MapReduce上检查谷歌的Paper

另外,如果您真的对Hadoop感兴趣,Hadoop : The Definitive Guide是必须有书。