2012-06-01 130 views

回答

1

RevolutionAnalytics/RHadoop实施RHadoop项目包通过rhdfs,rhbase和RMR连接的Hadoop和R。

我知道使用K-means聚类算法的“标准”方式(使用Python,Pig和Java,如幻灯片8-10所示)与仅使用R(使用rmr软件包,如幻灯片14- 15):它需要更少的代码,并且可以在一个单一的语言

实现在同一个文档有一个comparison implementation of K-means in Python, Java and R它展示了如何容易,如果你对你的Hadoop运行此包是使用R.

您肯定可以在Hadoop上编写K-means聚类。

IF R是不是你的选择,然后K-均值聚类(建立使用MapReduce的)可以用Hadoop和Mahout的,所以你一定能做到这一点的Hadoop集群。