-1

我正在开发一个近似计算系统。定义这两个对象的相似程度是这种系统的基本操作。还有其他有用的相似度或距离度量标准吗?

通常在计算机科学和数学,相似性是两个物体之间的距离的代名词,但它并不总是很清楚,我在这类型的应用程序下面的距离被使用:

  1. 杰卡德系数是用于排名和评分的信息检索。
  2. 余弦相似度用于实向量和它的使用用于例如测量文档之间的相似性(即使它不考虑术语位置,但只有频率)
  3. 海明距离用于二元载体和它用于测量计算机视觉和图像处理中二进制描述符(如ORB)之间的相似度
  4. 欧几里德距离用于实数矢量,它用于测量两点之间的距离(通常将其作为L^2距离)
  5. 内核函数:在机器学习中使用了一些内核函数(如RBF内核)来进行相似性度量,利用内核技巧。

我知道这些指标中的每一个都是以不同的方式定义的,但我想知道是否有调查报告或论文列出了计算机科学中每一种可能的应用(或其他人)不要报告)。你能帮助我吗?

+3

[关于概率密度函数之间的距离/相似性测量的综合调查](http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.154.8446),[距离/相似性度量的调查对于分类数据](http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=6889941),[二元相似性和距离测量的调查](http://citeseerx.ist.psu.edu/viewdoc /summary?doi=10.1.1.352.6123),[二元和数字数据的相似度量: 调查](http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.212.6533) – rcpinto

+2

也是一个修正:欧几里德距离适用于任何维数,而不仅仅是2。 – rcpinto

回答

相关问题