我有一个一维数据设置如下地图1D数据集三维空间
19, 23, 35, 39, 39, 48, 48, 72, 83, 91, 151, 152, 153, 156, 158, 160, 250, 340, 490
我想要得到的最频繁的范围内出这个值设置的。我想到了应用k均值聚类算法并采用大多数元素的聚类。我用k = sqrt(n/2)
输出应该151 - 160
当搜索我看到一些文章表明,应用k均值为一维数据集的聚类是不是一个好主意。所以我想到了地图1d数据集到3d空间。我所做的只是假设每个数据点的y和z坐标为0。
有没有更好的方法将这个数据集映射到三维空间? 或者是否有更好的方法来获取1d数据集中最频繁的范围?
感谢您的解释。但我没有得到那个动人的部分。我看到我可以将Jenks分类器用于1D数据集,而不是增加维度。这与你的意思是一样的吗? –
我不是Jenk分类器的粉丝(我更喜欢动态编程),但它是人们所期望并习惯的,因此使用它是有意义的。移动部分是因为我不确定你在问什么。它将回答诸如“在最小可能范围内的十个值在哪里?”等问题。 – mcdowella
嗯。在我的例子中,范围是151-60。 Coz是大部分数字组成的最小范围。我无法选择固定的窗口大小:这是问题所在。这就是为什么我想使用聚类。你有什么想法如何解决这类问题? –