2017-10-09 105 views
0

我想确保绘制了精确召回曲线。我有以下数据:回忆值= [0.0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0] 精度= [1,1,0.8,0.7,0.80,0.65,0.60,0.72 ,0.60,0.73,如下面 precision-recall curve精确召回图

0.75] interpolated_precision = [1,1,0.80,0.80,0.80,0.75,0.75,0.75,0.75,0.75,0.75] 并准备图表我不肯定是正确的,因为我看到了摇摆人物。一个例子是这里: enter image description here 我会很高兴,如果任何人都可以确认天气是错误的或不。

回答

0

您通常看到的锯齿线/锯齿图案更常见于更多的数据点(在示例图中注意至少20个左右,而您的正好10个),这些都来自实际搜索结果。你没有提到你的数据点来自哪里。

P-R数字经常看起来有点锯齿的原因是每次召回的增加通常伴随着精度的降低,至少暂时性的降低是由于可能增加误报。这在你的图中也是如此,然而,你的“下降”看起来更小,并且你的精度始终保持高。

但是,由于您将向下移动的图形绘制为对角线,因此在精度和内插精度的下移中,图中存在两个明显错误。

对于精度,任何向下移动都应该是垂直线。你不会从你描述的点的简单x-y图中得到这个,例如在Excel中。这些垂直线有助于“锯齿状”外观。

对于插值精度,图形将始终包含水平或垂直的垂直直线。内插精度的定义基本上要求(例如参见https://nlp.stanford.edu/IR-book/html/htmledition/evaluation-of-ranked-retrieval-results-1.html以获得在任何召回点的内插精度的正确定义)。

这里的关键是要认识到,您所描述的数据不应该作为独立的观察图来绘制,而应该以特定的方式为图的其余部分定义P-R值。