针对不同群体规模的精确度和召回计算

我没有在任何地方找到此问题的答案，所以我希望这里有人能够帮助我以及其他有同样问题的人。针对不同群体规模的精确度和召回计算

假设我有1000阳性标本和1500阴性样品。

现在，假设有950真阳性（正确地分类为阳性阳性样品）和100个误报（负样本错误地归类为阳性）。

我是否应该使用这些原始数据来计算精度，还是应该考虑不同的组大小？

换言之，应该我的精度是：

TruePositive /（TruePositive +假阳性） = 950 /（950 + 100）= 90.476％

OR它应该是：

（TruePositive/1000）/ [（TruePositive/1000）+（假阳性/ 1500）] = 0.95/（0.95 + 0.067）= 93.44％

在第一次计算中，我没有考虑每个组中样本数量的原始数字，而在第二次计算中，我使用了每个度量的比例组，以消除由组的不同尺寸造成的偏差

回答陈述的问题：通过definition，通过第一个公式计算精度：TP /（TP + FP）。

但是，这并不意味着你必须使用这个公式，即精确度量。还有很多其他的措施，看看this wiki page上的表格，然后选择一个最适合你的任务。

例如，positive likelihood ratio似乎与您的第二个公式最相似。

2015-12-19 22:41:57

回答