通常计算方式的精确度和召回率(这是我在论文中使用的)是衡量实体对方。假设基础事实具有以下(没有任何differentiaton因为他们是什么类型的实体)
[Microsoft Corp.] CEO [Steve Ballmer] announced the release of [Windows 7] today
这有3个实体。
假设您的实际提取具有CEO
和today
,为Windows 7
假阴性和Steve
子字符串匹配以下
[Microsoft Corp.] [CEO] [Steve] Ballmer announced the release of Windows 7 [today]
你必须精确匹配为Microsoft Corp
,误报我们通过首先定义匹配标准来计算精度和召回率。例如,他们是否必须完全匹配?如果它们重叠,它是否匹配?实体类型是否重要?通常我们想为这些标准中的几个提供精确度和召回率。
完全匹配:真阳性= 1(Microsoft Corp.
,唯一的精确匹配),假阳性= 3(CEO
,today
,和Steve
,这是不完全匹配),假阴性= 2(Steve Ballmer
和Windows 7
)
Precision = True Positives/(True Positives + False Positives) = 1/(1+3) = 0.25
Recall = True Positives/(True Positives + False Negatives) = 1/(1+2) = 0.33
任何重叠OK:真阳性= 2(Microsoft Corp.
,和Steve
重叠Steve Ballmer
),假阳性= 2(CEO
,并且today
),假阴性= 1(Windows 7
)
Precision = True Positives/(True Positives + False Positives) = 2/(2+2) = 0.55
Recall = True Positives/(True Positives + False Negatives) = 2/(2+1) = 0.66
读者然后离开来推断“真实性能”(精确度和记得,当允许使用人的无偏人类检查会给判断哪些重叠差异是重要的,哪些不重要)是在两者之间的某处。
通常报告测量是精确度和召回率的调和平均值,并且当您必须在精确度与回想率之间进行权衡时,会提供一些“性能”的概念。
+1全面! – KillBill 2012-08-22 15:56:59
很棒的回答。问题:在这种情况下,“真正的否定”是什么意思?我相信,需要计算准确性。 – 2016-01-19 19:42:32
假设我根据第二个策略评估(重叠是OK)。如何处理[史蒂夫] [鲍尔默]等情况?两个(部分)匹配都是正确的,真正的正数是如何计算的? – 2017-11-21 11:44:33