我有50件产品。对于每种产品,我想使用相似性度量标识以下四种相关产品。在Python中比较排名列表
- 1相关的最
- 2部分相关
- 1不相关
我想比较我的模型产生的排名列表(预测)由指定的排名列表领域专家(地面实况)。
通过阅读,我发现我可以使用基于等级相关的方法,比如Kendall Tau/Spearmen来比较排名列表。但是,我不确定这些方法是否合适,因为我的样本数量很少。(4)。如果我错了,请纠正我。
另一种方法是使用Jaccard相似度(设定交叉点)来量化两个排序列表之间的相似度。然后,我可以绘制来自setbased_list (见下文)的直方图。
for index, row in evaluate.iterrows():
d= row['Id']
y_pred = [3,2,1,0]
y_true = [row['A'],row['B'],row['C'],row['D']]
sim = jaccard_similarity_score(y_true, y_pred)
setbased_list.append(sim)
是我的方法上面正确的问题呢?
如果我想考虑列表中元素的位置(基于权重),我可以使用哪些其他方法?
为什么你确定一个产品是不相关的? – Rojan
这就像'控制'数据,以确保用户相应的排名.. – kitchenprinzessin