2017-09-13 51 views

回答

1

标准k-means是硬聚类算法,即没有拟合度;数据点属于一个且仅有一个群集。以下是来自相关academic paper的报价(强调增加):

2.3.1。 硬k均值

[...]

在K-均值聚类只二价隶属度对象的到 簇ķ被允许:λ[I,K]∈{ 0,1}。如果一个对象是 簇的成员它不可能是任何其它集群的成员

K-means++只是用于选择对k均值的初始值(种子)的算法,它并没有改变k-means作为硬聚类算法的基本特征。

0

有k-means允许的“软”变种

特别是模糊C均值(不要问我为什么他们用c代替k的...)

但要注意的是,所得的软质分配远非统计概率。这只是一个基于平方距离给出一些相对权重的数字,不包括任何强大的统计模型。