2016-11-11 28 views
0

我有一个装运目的地表,以lat,long为单位。我有一个固定的起点(也是经纬度)。我想通过聚类找到其他最佳原点位置。换句话说,我想分配一个集群质心(保持固定)并找到1,2,3。 。 。 N个其他集群质心。 scikit学习集群模块有可能吗?输入一个固定的集群质心,找到N个其他人(python)

回答

0

而不是为此回收集群,请将其视为常规优化问题。你不想“发现结构”,但是要优化成本。

请注意地球不平坦,欧几里德距离(即k-means)是一个坏主意。北纬1度仅在赤道与东经1度大致相同的距离。如果您的数据是例如在纽约,你有一个不可忽略的失真,你的解决方案甚至不会成为局部最优。

如果你绝对坚持滥用kmeans,这很容易做到。

随机选择n-1个中心和预定义的中心。 然后只运行1次k-means迭代。然后再次用期望的中心替换该中心。重复下一次迭代。

+0

是的,这显然不适用于任何情况,也不是分析的唯一部分。我只是想知道是否可以用scikit来进行探索性学习。我无法在文档或示例中找到可以指定一个集群质心并找到其他集合质心的示例。 – Carrie