2016-02-10 34 views
0

嗯,我有问题,我的数据多目标随着K-均值相同值

这是我的医疗保健数据库

(名称,值1,值2,值3,值4)

JHON 10, 20,30,40

JHON 9,12,21,33

诺亚8,第22,18,10

安娜9,19,29,32

克拉克11,4,17,20

在医疗数据库中的一个人可以生病2次,3次以上,你可以看到我的数据库的例子有2点JHON的谁有两个记录,因为他病了两次

我使用K-手段的目的是为了获得两个集群(集群1:第1组,第2组:第2组)及其成员

,我希望得到输出是这样的:

组1:jhon,克拉克

组2:诺亚,安娜,JHON

你看在两个JHON的,一个成员可以是组1和第2组,所以我怎么能解决这个问题?

回答

0

K-means通过成对步骤之间的迭代工作。您

  1. 之间基本上替代假设你知道实例集群的映射,并计算聚类中心

  2. 假设你知道的聚类中心,指定实例集群

因此如果您有约束条件,例如,所有jhon(原文如此)都属于同一个集群,那么可以将其纳入第2步:您需要找到最可能同时分配所有这些集群的集群。详情请参阅Constrained k-means clustering with background

+0

Ami先生我在第3.1节看到,在第二步中有一步一步的COP-Kmeans,它说:“对于D中的每个点di,将它分配给最接近的簇Cj,这样违反约束条件”这就是你的意思“你需要找到最可能同时分配它们的集群”? – Haikal

+0

是的。这是正确的部分。 –

+0

但我仍然不明白什么是'违反约束(二,Cj,Con =, con!=)'是算法还是其他? – Haikal