如果我在lrge训练集上训练支持向量机,并且如果类变量为True或False,与训练集中False值的数量相比,True值是否会影响训练模型/结果?他们应该是平等的吗?如果我的训练集不具有True和False的平等分布,我该如何照顾这一点,以便尽可能有效地完成我的训练?如何处理SVM中的数据不平衡?
6
A
回答
3
数据不平衡是很好的,因为SVM应该能够对与不太可能的实例相关的错误分类错误(例如您的案例中的“真”)分配更大的惩罚,而不是分配相同的错误权重,这会导致不合要求的分类器将所有内容分配给大多数人。但是,你会可能获得更好的结果与平衡的数据。这一切都取决于你的数据,真的。
您可以人为地歪曲数据以获得更平衡的数据。你为什么不检查这篇文章:http://pages.stern.nyu.edu/~fprovost/Papers/skew.PDF。
2
我的经验是,标准的SVM分类器不能很好地处理不平衡的数据。我遇到了C-SVM,它对于nu-SVM更糟糕。也许你想看看P-SVM,它提供了一种特别适用于不平衡数据的模式。
相关问题
- 1. OpenCV中的SVM:如何处理不平衡数据?
- 2. 如何处理高度不平衡的数据集
- 3. 如何处理多标签分类中的不平衡数据集
- 4. WCF + SSL如何处理负载平衡?
- 5. Xgboost处理不平衡的分类数据
- 6. 如何处理这种不平衡类别的倾斜数据集?
- 7. 长格式数据处理与不平衡观测
- 8. 使用权重处理不平衡数据
- 9. 不平衡括号(批处理文件)
- 10. ASP.Net - 在负载平衡环境中处理会话数据?
- 11. 如何处理reduce任务的不平衡输入?
- 12. 如何在R中创建平衡训练和不平衡测试数据集?
- 13. 不平衡分类数据
- 14. Sparkline数据帧不平衡
- 15. R优雅的平衡不平衡面板数据的方法
- 16. 如果不平衡的处理方法都不起作用
- 17. 如何处理负载平衡中的返回会话
- 18. 如何处理Solr中的负载平衡?
- 19. 如何用sklearn GroupKfold处理类别不平衡?
- 20. 收据不平衡
- 21. 并行处理的负载平衡
- 22. for cat平衡数据处理猫提高
- 23. 批处理标准化是否适用于平衡数据集?
- 24. 如何分类weka中的不平衡数据?
- 25. 不平衡数据的设计矩阵
- 26. Python多处理负载平衡器
- 27. 如何平衡numpy数组中的类?
- 28. 如何计算R中不平衡面板数据的逐年平均值?
- 29. 平衡如何平衡B-树
- 30. 如何将R中不平衡面板数据的数据调整超过99%?