0
我有点困惑与SSB计算群集评价 K均值聚类评价
凡
|Ci| is the size of cluster i
ci is the centroid of cluster i
c is the centroid of the overall data
这是什么“的总体数据的心”? 无处不在,它被称为整体数据的质心。
这是我们计算的初始质心吗?
编辑
多一点澄清anony - 摩丝的答案。
可以说我们在聚类中做了1次迭代。
step 1: k =2, select random centroids(Let my random centroids be (2,1,3) and (3,1,1))
step 2: do clustering(Now 2 clusters are formed)
step 3: then find new centroids(by averaging data for each cluster, After averaging let my new clusters be (2.3,1.5,3) and (6.7,1,2))
所以现在我需要计算SSB。
现在我需要计算整个数据(输入数据)的质心让这个值是(25,30.5,78)
total no of values in c1 = 20
total no of values in c2 = 30
ssbc1 = 20*(dist([2.3,1.5,3],[25,30.5,78]))^2
ssbc1 = 30*(dist([6.7,1,2],[25,30.5,78]))^2
total ssb = ssbc1+ssbc2
是不是这样?
好的。你能看到我的编辑 –