2017-01-25 121 views
0

我曾研究过分类器,特别是多分类器。我的问题是,当我使用精度和回忆来评估分类器时,我不明白的意思是假阳性假阴性在多分类器分类器评估中。多级分类器评估

例如,当我对一个文档(它的真实类别是C-1)进行分类时,分类器将它归类为C-2。那么,我应该增加C-2的假阳性并增加C-1的假阴性吗? (因为真正的答案是C-1。)

回答

0

由于你给出的例子是一个两类问题,我在你的例子的上下文中解释了假阳性和假阴性。

在2级的情况下,混淆矩阵通常看起来像以下:

 | Declare C-1 | Declare C-2 | 
|Is C-1| TP  | FN  | 
|Is C-2| FP  | TN  | 

在那里我已经使用的符号含义如下:

  • TP =真阳性(归类为C-1实际上是C-1)
  • FN =假阴性(归类为C-2但实际上是C-1)
  • FP =假阳性
  • TN = true否

从原始数据中,表中的值通常是测试数据上每次出现的计数。由此,我们可以相应地计算精度,召回率和其他值。

例如,您有一个表格,如下所示。

 | Declare C-1 | Declare C-2 | 
|Is C-1| 12  | 6  | 
|Is C-2|  8  | 11  | 

上表表示下列信息:

  • 12的文件被分类为C-1,它们实际上属于C-1。
  • 6个文件被分类为C-2,但它们实际上属于C-1。
  • 8个文件被分类为C-1,但它们实际上属于C-2。
  • 11个文件被分类为C-2,他们实际上属于C-2。

对于类别C-1:

Precision = 12/(12 + 8) 
Recall = 12/(12 + 6) 

对于类别C-2:

Precision = 11/(11 + 6) 
Recall = 11/(11 + 8) 

例如,当我分类文档(其真实类别是C-1 ),分类器将其分类为C-2。那么,我应该增加C-2的假阳性并增加C-1的假阴性吗? (因为真正的答案是C-1)

则应该增加计数其在与*以下指示其与Declare C-2Is C-1相关联的混淆矩阵的单元值。

 | Declare C-1 | Declare C-2 | 
|Is C-1|  0  | 0*  | 
|Is C-2|  0  | 0  |