1

我随机想出了一个数据组具有3个例子{1,2,3.5}我正确理解群集吗?

我试图用以下两个聚类技术:与q=2Ө =1.1
2.Sequential聚类

1.Hierarchical聚类。

无论使用哪个聚类技术,我总是想出了以下两个集群

{1,2}{3.5}

这是正确的吗?
看到使用两种完全不同的聚类技术,结果是相同的,这是相当令人惊讶的。

回答

3

我认为从3个值中查找两个群集的任务是扩展一个群集的定义。使用更多的数据点,以及比群集更多的数据点。

+1

你正在扩展一个轻描淡写的定义。 +1ワロタ – 2010-11-19 21:17:38

+1

@Anton :-)也许,但我是英国人,所以轻描淡写是遗传特征! – winwaed 2010-11-19 21:19:15

3

我不认为您的案例研究是不够详尽,以得出有意义的结论..

取一个数据集是足够大,以显示differencies,也因为连续的簇实际上创建群集而分层构建了一个树。这不是一回事。然后,它取决于您如何选择阈值来分割分层树和用于顺序聚类的偏差。

+0

谢谢,杰克,但基于我的微不足道的例子,如果使用这两种技术我做对了吗? – Kevin 2010-11-04 23:40:24

+2

你的意思是“正确的”?如果你的意思是,如果这两个算法应该给这个平凡的输入相同的结果,那么可能是的..但这就像想知道为什么排序列表{3,1,2}大致需要与插入排序或快速排序相同的时间.. – Jack 2010-11-05 00:38:48

1

为了更好地感受聚类,请下载WEKA并使用它聚类虹膜数据集。 WEKA具有多种可视化功能,可以让您感受到群集是什么。虹膜数据集很简单,只有少量特征,因此您可以理解结果。