2017-09-29 106 views
0

假设有一个数据集如下:计算权重的相似度得分

dataA: { 
    attribute1: x, 
    attribute2: y, 
    attribute3: z 
} 

我想要计算类似的结构化数据之间的相关性(如:dataA, dataB, dataC ...

我有一个相似性度量每个数据集的每个属性。 (如:的xattribute1其它值的相似性为0.11,的yattribute2其它值相似度0.22,具有的attribute3其它值的z相似度0.33)

我要去呈现的相关性得分其中,权重为每个属性定义的加权平均的方法(如:重attribute1w1等):

Score for dataA = { (0.11 x w1) + (0.22 x w2) + (0.33 x w3) }/{w1 + w2 + w3} 

如果我打算做一个实验,找到最优权重,我该怎么办它?

UPDATE:

我可以做一个试验,以检查每个属性值的概率要更改,然后使用该值不知何故?

回答