2015-10-09 200 views
1

我对我的数据集使用sklearn.cluster.MiniBatchKMeans。我想找到“(1 /样本数量)*(x(i) 与其聚类中心之间的平方距离的总和)”,如下图所示。k均值聚类的成本函数

Cost function

有一个在 “sklearn.cluster.MiniBatchKMeans” 一个 “inertia_”。我在想, “inertia_” 是计算这个数字?或者有没有其他方法可以找到它。 感谢您的考虑。

+0

http://scikit-learn.org/stable/modules/clustering.html#k-means 看起来像是你想要的。但是,您可以计算训练集中每个点与其中心之间的平方距离总和,以进行双重检查。 –

回答

0

这是正确的。根据他们的文档,它们定义为inertia

所以,从你的估计得到的惯性,抢sklearn.cluster.MiniBatchKMeans.inertia_