2013-07-08 47 views
0

我已经应用集群交易算法如K均值,K-medoid和DBSCAN对我的病人的数据集。对于每个ALGO RapidMiner生成集群模型(质心表和图表等)和聚簇集(显示哪些实例是群集的一部分)。现在我想要某种方式,当一个新病人来时,我想根据以前的训练模型为他分配一个聚类。我很困惑,要做到这一点..的方式是类似的东西,我可能是错的如何在质心基群集中重新聚类新实例?

新病人的每个属性值 - 从心表 该属性值总结病人和采取的属性的所有分歧平均。

然后分配给他的集群,其平均最小相对于该患者。

如果这是正确的方法,那么我将如何重新聚类,即当新病人来我们的算法是分配他的群集,这是有意义的。质心移动,然后我不得不重新聚集每个记录插入。如何在我的情况下处理这个问题?

+0

这个问题属于上stats.stackexchange.com –

回答

0

看看在线聚类算法,如果你想将它们应用到流。

存在诸如在线k-means变体等事物。

通常,您的确希望避免重新聚集所有现有示例,因为这对于无限数据流和有限内存不起作用。

通常这是一个好主意不是尝试得到完全相同的结果,如果你运行了经典的聚类算法,但学会忍受一些错误。毕竟,所有这些算法无论如何已经只是启发式。只要你的近似是好的,近似启发式就没有错。