0
我正在尝试在数据使用上执行kmeans算法。运行时必须传递的选项需要一个到初始集群的路径。任何人都可以告诉我,即使在启动算法之前,我们如何拥有初始簇?使用mahout进行Kmeans聚类
bin/mahout kmeans \
-i <input vectors directory> \
-c <input clusters directory> \
-o <output working directory> \
-k <optional number of initial clusters to sample from input vectors> \
-dm <DistanceMeasure> \
-x <maximum number of iterations> \
-cd <optional convergence delta. Default is 0.5> \
-ow <overwrite output directory if present>
-cl <run input vector clustering after computing Canopies>
-xm <execution method: sequential or mapreduce>
[这里](http://unmeshasreeveni.blogspot.in/2014/11/how-to-run-k-means-clustering-in-mahout.html)是运行综合控制数据的一个例子。 – 2014-12-08 03:38:20