2013-06-11 40 views

回答

-1

那么你可以使用WEKA均值在这里,我发现something

您可以下载该项目以查看源代码here

+0

这究竟是如何帮助一个算法,根本不使用点对点距离(矩阵或不)? –

1

K-意味着不能与一起使用距离矩阵。

因为它从不计算/使用点对点的相似性! (另外,它可以在不到二次时间这种方式运行...)

相反,它计算分配对象聚类中心(从技术上说,这是欧氏距离平方的方差贡献点对点中心;但您不应该在这里实际插入其他距离。)并且,由于质心移动,您无法预先计算这些距离。

但是,存在变体的k-均值没有这个限制,特别是K-冥王星又名PAM(查看维基百科)。这些不使用集群中心,而是使用medoids(因此是名称),它们是您的数据集的点。