我想知道在处理真正不平衡的数据集时,如何惩罚较少表示的类,而不是处理其他类(在大约20000个样本上有10个类,但这里是每个类的出现次数:[10868 26 4797 26 8320 26 5278 9412 4485 16172])。如何处理多标签分类中的不平衡数据集
我读了关于Tensorflow函数:weighted_cross_entropy_with_logits(https://www.tensorflow.org/api_docs/python/tf/nn/weighted_cross_entropy_with_logits),但我不确定我可以用它来解决多标签问题。
我找到了一个职位,总结完美的问题,我有(Neural Network for Imbalanced Multi-Class Multi-Label Classification),并且提出了一个想法,但没有答案,我认为这个想法可能是好的:)
感谢您的想法和答案!
谢谢你的回答,但如果我理解正确,你使用Softmax,所以你要做的是将你的多标签问题分为两个多类单标签问题(一个用于形状,另一个用于对象类别)。这不是我的情况,我有一个“真正”的多标签问题(不可分离),所以我猜你提出的建议不适合我的问题。但是,谢谢你的回答,以后可能对我有用:) –
所以也许在你的情况'tf.nn.sigmoid_cross_entropy_with_logits'可以是有用的。祝你好运。 –
是的,这就是我目前正在做的!但是,真的不知道如何解决我的不平衡数据集:) –