2010-02-23 35 views
3

我试图检测输入矢量如何适合给定的聚类中心。我可以很容易地找到最佳匹配(与输入矢量最小欧几里得距离的中心是最好的),但是,现在我需要工作的比赛有多好。查找Kmeans中每个群集的传播

为此,我需要找到构成质心的向量的扩展(标准偏差?),然后查看从我的输入向量到中心的距离是否小于扩展。如果它比传播更多,那么我应该可以说我没有群集来适应它(因为最好的输入向量不适合)。

我不知道如何找到每个群集的传播。我拥有所有的中心矢量,并且所有的训练矢量都用最近的聚类标记,我不能完全了解我需要做什么来扩展。

我希望这是明确的?如果没有,我会尽量重新说一遍! TIA Ian

回答

4

使用距离函数并计算从中心点到每个标记点的距离,然后计算出这些距离的平均值。这应该会给你标准偏差。