0
假设有一个数据集如下:计算权重的相似度得分
dataA: {
attribute1: x,
attribute2: y,
attribute3: z
}
我想要计算类似的结构化数据之间的相关性(如:dataA, dataB, dataC ...
)
我有一个相似性度量每个数据集的每个属性。 (如:的x
与attribute1
其它值的相似性为0.11,的y
与attribute2
其它值相似度0.22,具有的attribute3
其它值的z
相似度0.33)
我要去呈现的相关性得分其中,权重为每个属性定义的加权平均的方法(如:重attribute1
是w1
等):
Score for dataA = { (0.11 x w1) + (0.22 x w2) + (0.33 x w3) }/{w1 + w2 + w3}
如果我打算做一个实验,找到最优权重,我该怎么办它?
UPDATE:
我可以做一个试验,以检查每个属性值的概率要更改,然后使用该值不知何故?