2017-05-02 42 views
0

使用K均值聚类时,我删除了独立变量的前5位和后5位百分位数值,因此我在几个数据点上丢失了数据。 现在我使用K均值聚类后,我得到每个数据点的聚类。我如何获得先前由于异常值而被删除的数据点群集K表示聚类

回答

0

那么只需执行具有异常值处理的整个K-means即可。一旦算法完成(在每次迭代中删除异常值),您可以将它们分配回最近的群集。这样,聚类的含义不会改变,但异常值会得到合适的标签。

+0

嗨,请告诉我如何将它们分配回集群,因为我必须使用多个变量来计算距离。另外,我应该计算距标准值还是正常值的距离 – Rahul