我没有在任何地方找到此问题的答案,所以我希望这里有人能够帮助我以及其他有同样问题的人。针对不同群体规模的精确度和召回计算
假设我有1000阳性标本和1500阴性样品。
现在,假设有950真阳性(正确地分类为阳性阳性样品)和100个误报(负样本错误地归类为阳性)。
我是否应该使用这些原始数据来计算精度,还是应该考虑不同的组大小?
换言之,应该我的精度是:
TruePositive /(TruePositive +假阳性) = 950 /(950 + 100)= 90.476%
OR它应该是:
(TruePositive/1000)/ [(TruePositive/1000)+(假阳性/ 1500)] = 0.95/(0.95 + 0.067)= 93.44%
在第一次计算中,我没有考虑每个组中样本数量的原始数字,而在第二次计算中,我使用了每个度量的比例组,以消除由组的不同尺寸造成的偏差