我正在使用k-means和NGD(标准化Google距离)对术语进行聚类。 我有一个距离矩阵作为k-means算法的输入。 在这种情况下可以运行k-means吗?你能建议任何源代码吗?java k-means使用距离矩阵的术语聚类
谢谢你在前进,
纳斯
我正在使用k-means和NGD(标准化Google距离)对术语进行聚类。 我有一个距离矩阵作为k-means算法的输入。 在这种情况下可以运行k-means吗?你能建议任何源代码吗?java k-means使用距离矩阵的术语聚类
谢谢你在前进,
纳斯
K-意味着不能与一起使用距离矩阵。
因为它从不计算/使用点对点的相似性! (另外,它可以在不到二次时间这种方式运行...)
相反,它计算分配对象聚类中心(从技术上说,这是欧氏距离平方的方差贡献点对点中心;但您不应该在这里实际插入其他距离。)并且,由于质心移动,您无法预先计算这些距离。
但是,存在变体的k-均值没有这个限制,特别是K-冥王星又名PAM(查看维基百科)。这些不使用集群中心,而是使用medoids(因此是名称),它们是您的数据集的点。
这究竟是如何帮助一个算法,根本不使用点对点距离(矩阵或不)? –