我随机想出了一个数据组具有3个例子{1,2,3.5}
我正确理解群集吗?
我试图用以下两个聚类技术:与q=2
和Ө =1.1
2.Sequential聚类
1.Hierarchical聚类。
无论使用哪个聚类技术,我总是想出了以下两个集群
{1,2}
和{3.5}
这是正确的吗?
看到使用两种完全不同的聚类技术,结果是相同的,这是相当令人惊讶的。
我随机想出了一个数据组具有3个例子{1,2,3.5}
我正确理解群集吗?
我试图用以下两个聚类技术:与q=2
和Ө =1.1
2.Sequential聚类
1.Hierarchical聚类。
无论使用哪个聚类技术,我总是想出了以下两个集群
{1,2}
和{3.5}
这是正确的吗?
看到使用两种完全不同的聚类技术,结果是相同的,这是相当令人惊讶的。
我认为从3个值中查找两个群集的任务是扩展一个群集的定义。使用更多的数据点,以及比群集更多的数据点。
我不认为您的案例研究是不够详尽,以得出有意义的结论..
取一个数据集是足够大,以显示differencies,也因为连续的簇实际上创建群集而分层构建了一个树。这不是一回事。然后,它取决于您如何选择阈值来分割分层树和用于顺序聚类的偏差。
为了更好地感受聚类,请下载WEKA并使用它聚类虹膜数据集。 WEKA具有多种可视化功能,可以让您感受到群集是什么。虹膜数据集很简单,只有少量特征,因此您可以理解结果。
你正在扩展一个轻描淡写的定义。 +1ワロタ – 2010-11-19 21:17:38
@Anton :-)也许,但我是英国人,所以轻描淡写是遗传特征! – winwaed 2010-11-19 21:19:15