2016-11-18 31 views

回答

-2

您很难在细长的数据集中选择一个初始聚类中心点,但它对结果有很强的影响。选择不同的点时可能会得到不同的结果。

,当你选择3个初始化点,你会得到在这种情况下,只有一个结果:

enter image description here

但它在拉长的数据集不同。

+0

选择细长数据上的初始点并不困难。 –

0

如果您看目标函数,并且将x轴缩放10倍,则它变得更重要100倍。

对于“拉长”的数据,“长”维对结果有很大的影响,其他因素往往被忽略。

由于k-means是一种无监督算法,因此无法学习权重来对付这种情况。分类器(如线性SVM或决策树)可以做到这一点,因此不存在此问题。