0
我曾研究过分类器,特别是多分类器。我的问题是,当我使用精度和回忆来评估分类器时,我不明白的意思是假阳性和假阴性在多分类器分类器评估中。多级分类器评估
例如,当我对一个文档(它的真实类别是C-1)进行分类时,分类器将它归类为C-2。那么,我应该增加C-2的假阳性并增加C-1的假阴性吗? (因为真正的答案是C-1。)
我曾研究过分类器,特别是多分类器。我的问题是,当我使用精度和回忆来评估分类器时,我不明白的意思是假阳性和假阴性在多分类器分类器评估中。多级分类器评估
例如,当我对一个文档(它的真实类别是C-1)进行分类时,分类器将它归类为C-2。那么,我应该增加C-2的假阳性并增加C-1的假阴性吗? (因为真正的答案是C-1。)
由于你给出的例子是一个两类问题,我在你的例子的上下文中解释了假阳性和假阴性。
在2级的情况下,混淆矩阵通常看起来像以下:
| Declare C-1 | Declare C-2 |
|Is C-1| TP | FN |
|Is C-2| FP | TN |
在那里我已经使用的符号含义如下:
从原始数据中,表中的值通常是测试数据上每次出现的计数。由此,我们可以相应地计算精度,召回率和其他值。
例如,您有一个表格,如下所示。
| Declare C-1 | Declare C-2 |
|Is C-1| 12 | 6 |
|Is C-2| 8 | 11 |
上表表示下列信息:
对于类别C-1:
Precision = 12/(12 + 8)
Recall = 12/(12 + 6)
对于类别C-2:
Precision = 11/(11 + 6)
Recall = 11/(11 + 8)
例如,当我分类文档(其真实类别是C-1 ),分类器将其分类为C-2。那么,我应该增加C-2的假阳性并增加C-1的假阴性吗? (因为真正的答案是C-1)
则应该增加计数其在与*
以下指示其与Declare C-2
和Is C-1
相关联的混淆矩阵的单元值。
| Declare C-1 | Declare C-2 |
|Is C-1| 0 | 0* |
|Is C-2| 0 | 0 |