0
我已经在数据集上实现了k-means聚类。我试图通过查看快速采矿者给出的平行和偏差图来分析聚类k。分析簇均匀性并使用RapidMiner中的簇距离性能算子
其目的是分析簇的均匀性。在给定的各种性能模型中,运算符“簇距离性能”运算符用于k均值聚类的结果。
- 是否有其他运营商可以提供此类分析?
- 我拥有的数据集具有较大的数值向量(在 数百和数千),我也有一个数据集,其极小值(小数点后5至8位)极其小。
我不知道如何解释,我从运营商“群集距离性能”得到的结果如下图所示
重心表结果
和高性能矢量操作结果是
有人可以帮我这个吗?尽管我认为Davies Bouldin的价值越小,集群越好。
如果您需要一些关于编写一个过程来遍历k的所有可能值并计算有效性度量的指导,您可以在这里看到一个示例http://rapidminernotes.blogspot.co.uk/2011/03/counting-集群部分-ii.html – awchisholm