2010-07-27 230 views
14

有人可以指向一个好的网站,有很好的Hadoop算法集合。例如,我现在可以用Hadoop完成的最复杂的事情就是Page Rank。除此之外,我可以做一些简单的事情,如字数和东西。Hadoop地图减少:算法

我想看到一个网站,显示我的其他使用hadoop。

回答

1

本页面给出了一些常见的地图的一个很好的概述,从建立一个倒排索引中广泛的应用减少模式,以实现网页排名和做连接和其他集合运算

http://highlyscalable.wordpress.com/2012/02/01/mapreduce-patterns/

基本上,无论你看到线性代数(矩阵/矢量操作),就可以申请的Map Reduce。这意味着在协作过滤中有很多应用(比如Netflix推荐),集群和其他机器学习算法。另一个非常有趣的项目是Mahout,该项目旨在通过Hadoop在MapReduce上实现可扩展的机器学习算法。

http://mahout.apache.org/