2015-11-04 61 views
0

如何在不给k值的情况下在k均值算法中生成聚类。 我想做k-均值聚类并自动生成群集。具有k值的K均值聚类自动生成

+0

看到这个 https://datasciencelab.wordpress.com/2013/12/27/finding-the-k -in-k-means-clustering/ – ZenithS

+0

感谢ZenithS,你建议的链接真的有帮助 – Asif

+0

一个简单的谷歌搜索导致https://en.wikipedia.org/wiki/Determining_the_number_of_clusters_in_a_data_set –

回答

0

您可能尝试使用均值漂移聚类,它表现得像k均值聚类,并且没有k参数。

其基本思想如下:聚类就像增加数据集中的“高频”或“锐化”数据集一样,以便找到“模式”(“模式”对应于重要的“趋势“在你的数据集中)。 逆操作,即平滑数据集,更容易定义(简而言之,用每个样本的邻居平均值代替)。因此,根据该定义,可以提取信号的“高频”分量,即初始信号和平滑信号之间的差异。这给你一个“梯度方向”,或一个“好动作”,这将使信号变得尖锐。在这个过程结束时,所有的样本都会聚集在少数点上,对应于“模式”。

参考: https://en.wikipedia.org/wiki/Mean_shift