2017-01-24 117 views
0

我有点困惑与SSB计算群集评价 enter image description hereK均值聚类评价

|Ci| is the size of cluster i 
ci is the centroid of cluster i 
c is the centroid of the overall data 

这是什么“的总体数据的心”? 无处不在,它被称为整体数据的质心。

这是我们计算的初始质心吗?

编辑

多一点澄清anony - 摩丝的答案。

可以说我们在聚类中做了1次迭代。

step 1: k =2, select random centroids(Let my random centroids be (2,1,3) and (3,1,1)) 
step 2: do clustering(Now 2 clusters are formed) 
step 3: then find new centroids(by averaging data for each cluster, After averaging let my new clusters be (2.3,1.5,3) and (6.7,1,2)) 

所以现在我需要计算SSB。

现在我需要计算整个数据(输入数据)的质心让这个值是(25,30.5,78)

total no of values in c1 = 20 
total no of values in c2 = 30 

ssbc1 = 20*(dist([2.3,1.5,3],[25,30.5,78]))^2 
ssbc1 = 30*(dist([6.7,1,2],[25,30.5,78]))^2 
total ssb = ssbc1+ssbc2 

是不是这样?

回答

0

质心是每个维度的平均值。

“所有数据”中说聚类是而不是使用。

+0

好的。你能看到我的编辑 –