1

我没有在任何地方找到此问题的答案,所以我希望这里有人能够帮助我以及其他有同样问题的人。针对不同群体规模的精确度和召回计算

假设我有1000阳性标本1500阴性样品

现在,假设有950真阳性(正确地分类为阳性阳性样品)和100个误报(负样本错误地归类为阳性)。

我是否应该使用这些原始数据来计算精度,还是应该考虑不同的组大小?

换言之,应该我的精度是:

TruePositive /(TruePositive +假阳性) = 950 /(950 + 100)= 90.476%

OR它应该是:

(TruePositive/1000)/ [(TruePositive/1000)+(假阳性/ 1500)] = 0.95/(0.95 + 0.067)= 93.44%

在第一次计算中,我没有考虑每个组中样本数量的原始数字,而在第二次计算中,我使用了每个度量的比例组,以消除由组的不同尺寸造成的偏差

回答

2

回答陈述的问题:通过definition,通过第一个公式计算精度:TP /(TP + FP)。

但是,这并不意味着你必须使用这个公式,即精确度量。还有很多其他的措施,看看this wiki page上的表格,然后选择一个最适合你的任务。

例如,positive likelihood ratio似乎与您的第二个公式最相似。