2011-11-23 27 views

回答

1

您可以定义一个函数,根据属性权重来计算两点之间的距离。例如,这将是加权欧几里德距离

具体而言,如果数据集中每个点有k个属性,并且属性的相应权重为d1,d2,..,dk,则两个点X和Y之间的距离是

d(X,Y)=总和(二*(XI-易)^ 2)I = 1,2..k其中X是第i个属性的值的点X.

如果权重是属性方差的倒数,它降低到马氏距离

http://en.wikipedia.org/wiki/Mahalanobis_distance

定义距离函数后,可以使用K-means对数据进行聚类。