为了评估我的图像检索系统,我正在阅读很多关于Precision-Recall曲线的内容。特别是,我正在阅读关于VLFeat中的特征提取器的文章this以及关于精确调用的wikipedia page。关于精度调用曲线和平均精度的困惑
我知道这条曲线对评估我们的系统性能w.r.t很有用。检索的元素的数量。所以我们反复计算检索顶部元素的精度 - 回忆,然后回到顶部2,顶部3等...但我的问题是:什么时候我们停止?
我的直觉是:当我们的检索元素列表的回忆等于1时,我们停止,因此我们检索所有相关元素(即没有错误否定,只有真正的肯定)。
同样的问题是平均精度:检索结果中应该存在多少个元素来计算它?如果我以前的直觉是正确的,那么我们只需要找出什么是最小的列表s.t.召回是1,并用它来计算AP。
我不知道为什么所有用于计算p-r曲线的库都没有显示这是如何实现的?
感谢您的详细解答,这真的很有帮助。请阅读[this](http://stackoverflow.com/questions/40906671/confusion-about-mean-average-precision)有关平均精度的相关问题 – justHelloWorld