如何在质心基群集中重新聚类新实例？

我已经应用集群交易算法如K均值，K-medoid和DBSCAN对我的病人的数据集。对于每个ALGO RapidMiner生成集群模型（质心表和图表等）和聚簇集（显示哪些实例是群集的一部分）。现在我想要某种方式，当一个新病人来时，我想根据以前的训练模型为他分配一个聚类。我很困惑，要做到这一点..的方式是类似的东西，我可能是错的如何在质心基群集中重新聚类新实例？

新病人的每个属性值 - 从心表该属性值总结病人和采取的属性的所有分歧平均。

然后分配给他的集群，其平均最小相对于该患者。

如果这是正确的方法，那么我将如何重新聚类，即当新病人来我们的算法是分配他的群集，这是有意义的。质心移动，然后我不得不重新聚集每个记录插入。如何在我的情况下处理这个问题？

来源

2013-07-08 Mona

这个问题属于上stats.stackexchange.com –

看看在线聚类算法，如果你想将它们应用到流。

存在诸如在线k-means变体等事物。

通常，您的确希望避免重新聚集所有现有示例，因为这对于无限数据流和有限内存不起作用。

通常这是一个好主意不是尝试得到完全相同的结果，如果你运行了经典的聚类算法，但学会忍受一些错误。毕竟，所有这些算法无论如何已经只是启发式。只要你的近似是好的，近似启发式就没有错。

来源

2013-07-08 16:50:42

如何在质心基群集中重新聚类新实例？

回答

相关问题