我发现,虽然训练了一些CNN和RNN对不平衡训练数据,但我的训练收敛速度相对较快,准确度在大类的百分比附近(例如if有80%是例子,它可能总是输出是)。我发现可以解释..这个解决方案是一个局部最优化的,并且在训练时网络无法逃脱它。这个解释是否正确,并且这种行为大多发生在这些情况下? 我能对付它吗?合成更多的训练数据以使得该设置更均匀?还有什么? 非常感谢!机器学习的非平衡训练数据(CNN/RNN)
1
A
回答
1
是的,你是对的。不平衡的培训数据会影响准确性。一些解决不平衡类问题的方法如下:
1)更多数据收集:这在某些情况下并不容易。例如,与非欺诈案件相比,有少数欺诈案例。
2)欠采样:从大多数类中删除数据。你可以删除它随机或信息(以帮助从分布来决定要删除什么零件/补丁)
3)过采样:复制属于少数课堂观察。
1
你的问题与TF无关,这是机器学习中的标准问题。只需在google中输入“在机器学习中处理不平衡数据”并阅读几页。
这里有几个方法:
- 获得更多的数据
- 使用其他度量(F1)
- 欠/过采样/加权
相关问题
- 1. 机器学习 - 特征选择和训练数据
- 2. 非平凡的Java数学练习
- 3. 初始训练是否适用于非平衡数据集? (Tensorflow)
- 4. 训练集平衡策略
- 5. Python机器学习训练Classifer错误指数是越界
- 6. 非平衡类指标和scikit学习
- 7. 来自不平衡数据的分层均衡采样(机器学习)
- 8. 什么是训练机器学习的步骤时间?
- 9. 受过训练的机器学习模型太大
- 10. 具有硬件限制的机器学习模型训练
- 11. 如何通过svmlight提供平衡训练数据集的平衡训练成本?
- 12. 线性回归机器学习训练模型与庞大的数据
- 13. 机器学习训练数据集的大小应该是多少?
- 14. 机器学习,训练后,它如何得到预测? opencv
- 15. 在机器学习训练之前处理20x20图像
- 16. 机器学习:按重要性加权训练点
- 17. 如何在R中创建平衡训练和不平衡测试数据集?
- 18. 培训机器学习预测器
- 19. 决策树学习算法中的重复训练数据
- 20. Autoencoder在训练时未学习
- 21. 麻烦训练SVM(scikit学习包)
- 22. 机器学习:预测输入向量训练“匹配”的输出数
- 23. 深度学习训练数据集向Caffe
- 24. 不平衡训练数据集和回归模型
- 25. 机器学习 - 培训步骤
- 26. 训练有素的垃圾邮件机器学习分类器/型号
- 27. 如何使用MFCC系数向量训练机器学习算法?
- 28. 学习jQuery的练习练习
- 29. 数学练习题
- 30. 机器学习中偏斜类和不平衡类