2016-04-29 119 views
5

我试图从tensorflow提供的CIFAR-10示例的修改版本绘制ROC曲线。它现在为2类,而不是10如何用Tensorflow和scikit-learn绘制ROC曲线?

的网络的输出被称为logits并采取以下形式:

[[-2.57313061 2.57966399] [0.04221377 -0.04033273] [-1.42880082 1.43337202] [ -2.7692945 2.78173304] [-2.48195744 2.49331546] [2.0941515 -2.10268974] [-3.51670194 3.53267646] [-2.74760485 2.75617766] ...]

首先,做这些logits实际上代表什么?网络中的最后一层是WX + b形式的“softmax linear”。

该模型能够通过调用

top_k_op = tf.nn.in_top_k(logits, labels, 1) 

然后计算精度,一旦图形已经被初始化:

predictions = sess.run([top_k_op]) 
predictions_int = np.array(predictions).astype(int) 
true_count += np.sum(predictions) 
... 
precision = true_count/total_sample_count 

这工作得很好。

但现在我怎么能从这个绘制ROC曲线?

我一直在尝试“sklearn.metrics.roc_curve()”函数(http://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_curve.html#sklearn.metrics.roc_curve),但我不知道用什么作为我的“y_score”参数。

任何帮助,将不胜感激!

+0

请参阅此处[链接](http://stackoverflow.com/questions/35811446/classification-accuracy-after-recall-and-precision/37275638#37275638)以获得计算并绘制ROC曲线的代码。 –

回答

1

“y_score”这里应该是对应于每个将被归类为阳性样品的概率的阵列(如果正在您的y_true阵列标记为1)

实际上,如果网络使用使用SoftMax作为最后一层,那么模型应该输出这个实例的每个类别的概率。但是你在这里给出的数据不符合这种格式。我检查了示例代码:https://github.com/tensorflow/tensorflow/blob/r0.10/tensorflow/models/image/cifar10/cifar10.py 它似乎使用了一个名为softmax_linear的图层,我对此示例知之甚少,但我想您应该使用Logistic Function之类的东西处理输出以将其转换为概率。

然后,只需用你的真实标签, 'y_true' 喂其传递给scikit学习功能:

y_score = np.array(output)[:,1] 
roc_curve(y_true, y_score) 
0
import tensorflow as tf 
tp = [] # the true positive rate list 
fp = [] # the false positive rate list 
total = len(fp) 
writer = tf.train.SummaryWriter("/tmp/tensorboard_roc") 
for idx in range(total): 
    summt = tf.Summary() 
    summt.value.add(tag="roc", simple_value = tp[idx]) 
    writer.add_summary (summt, tp[idx] * 100) #act as global_step 
    writer.flush() 

然后开始tensorboard:

tensorboard --logdir=/tmp/tensorboard_roc 

tensorboard_roc

有关详细信息和代码,您可以访问我的博客:http://blog.csdn.net/mao_feng/article/details/54731098

+0

我在我的模型中使用了这段代码,但在张量板上我只看到了一条从(0,0)开始的直线。 – Kyrol