2012-11-20 37 views
2

我有一个包含国家名称,位置,HDI(人类发展指数)和人口等数据的大型数据库。我需要根据人口将这些数据分为几个“K”组。我的一位朋友建议,在这种情况下,K-means clustring会很有用。但我想,这可以通过按照人口对数据进行排序直接完成,然后将这些排序后的数据分成组。这两种方法有没有区别?K意味着对数据进行聚类或排序

谢谢

回答

1

沿着一个维度的递归分割导致决策树。它是一个不同的数据结构。组之间的所有切割都沿着轴(水平或垂直)。 K-means可以达到平衡,因为切割不一定是水平或垂直的(大部分时间不是)。

其实,决策树方法也是非常有用的。你可以试试它。

相关问题