2017-03-08 150 views
1

我训练AK意味着我的数据集模型,现在我想获得从每个集群的几个要素与集群ID获得集群和集群的第一要素IDS k均值火花

val clusters = KMeans.train(data, numClusters, numIterations) 

val vectorsAndClusterIdx = data.map{ point => 
    val prediction = clusters.predict(point) 
    (point.toString, prediction) 
} 

沿着但后来有一次我有,我不知道如何打印这些元素与他们的群集ID

回答

1

如果我了解你,你想打印每个点与其分配的群集ID。

你可以尝试这样的事:

vectorsAndClusterIdx.collect().foreach(println(_)) 

或者,也许它会更好:

println(dataClustered.collect().mkString("\n")) 
+0

谢谢你,你的第一个解决方案的伟大工程:)我想究竟是什么,如果可能的话,从每个集群中获得10个元素 –

+0

@ laure-d:如果您对以上答案还可以,请注意投票/接受答案 –

+0

我是,但不是完全的,我的意思是,我会感激只得到10个如果可能的话,来自每个群集的元素,而不是所有元素 –