2014-07-15 58 views
0

我已阅读scikit学习文档,并使用Google搜索无济于事。我有2000个数据集,如图所示聚集在一起。如图所示,一些群集是错误的,这里是红色的群集。我需要一个指标来验证所有2000个集群集。在scikit学习中几乎所有的度量标准都需要地面真实类标签,我认为这些标签对于这个问题并不具备。我有30天的小时交通流量,我用k-means对它们进行聚类。线是聚类中心。我该怎么办?我甚至在正确的轨道上?!横轴是小时,0到23,纵轴是交通流量,所以数据点表示30天内那个小时内的交通流量,k = 3。K均值指标

image

+1

聚类的验证是不是适定性问题,如果你没有地面实况做。 – eickenberg

+0

那么处理这种情况的正确方法是什么? – plumSemPy

+0

“错”是什么意思?另外,我不太了解情节。这些点意味着什么?什么是单一数据点? –

回答