2017-04-04 47 views
0

如果我想向现有的分类模型添加更多的训练数据。由于标注训练数据的成本很高,我只想将最有价值的数据标注到现有模型中。如何在张量流框架下获得最有价值的训练数据

例如,我们只有两个班(A/B)在我们的分类问题,然后利用现有的模型来预测三个联合国标号数据,并获得概率分布:

Data    A B 
Case 1: features -> 0.9 0.1 
Case 2: features -> 0.6 0.4 
Case 3: features -> 0.5 0.5 

案例3应该是最有价值的培训数据,因为当前模型不知道它属于哪个类。这样对吗?如果是的话,熵应该是一个很好的指标,但我不能找到执行tf.reduce_entropytensorflow

回答

相关问题