0
我在Mahout中运行KMeans
聚类算法。我正在使用KMeansDriver.run
函数,因为我也使用Hadoop。
我想知道在哪个文件中存储final centroids
。这与我们为初始集群提供的文件相同。
另外我想问一下part-m
和part-r
文件生成的含义是什么?在Mahout中聚类后存储哪个文件最终质心
我在Mahout中运行KMeans
聚类算法。我正在使用KMeansDriver.run
函数,因为我也使用Hadoop。
我想知道在哪个文件中存储final centroids
。这与我们为初始集群提供的文件相同。
另外我想问一下part-m
和part-r
文件生成的含义是什么?在Mahout中聚类后存储哪个文件最终质心
它存储在centroid-final下的质心文件夹中。 部分-m是映射器的输出I.e没有减少工作 部分-r是减速器的输出