我正在研究数据的二进制分类,我想知道使用支持向量机优于决策树和自适应增强算法的优缺点。支持向量机优于分支树和AdaBoost算法
回答
你可能想要做的事情是使用weka,这是一个很好的包,你可以用它来插入你的数据,然后尝试一堆不同的机器学习分类器,看看每个分类器如何在你的特定集合上工作。对于机器学习的人来说,这是一条走得很好的路。
对于您的特定数据或您正在尝试解决的分类问题一无所知,我无法超越仅仅告诉您关于每种方法的随机事情。这就是说,这是一个大脑转储和一些有用的机器学习幻灯片的链接。
Adaptive Boosting使用弱基分类委员会对样本点的类别分配进行投票。基分类器可以是决策树,决策树,SVM等。它需要一种迭代方法。在每一次迭代中 - 如果委员会对特定样本的类别分配达成一致并且正确,那么它会变得加权下来(在下一次迭代中不太重要),如果委员会不一致,则变成(更重要的是在下一次迭代中对右分类)。 Adaboost以具有良好的泛化能力而着称(不是过度拟合)。
SVMs是一个有用的第一次尝试。另外,你可以在SVM中使用不同的内核,不仅可以获得线性决策边界,而且可以获得更多趣味形状的内核。如果你把L1正则化(松弛变量),那么你不仅可以防止过拟合,而且可以分类不可分离的数据。
Decision trees是有用的,因为他们可以解释任何人。它们很容易使用。使用树也意味着你也可以了解某个特征对于制作树有多重要。你可能想要检查的东西是添加树(如MART)。
“如果委员会对特定样本的类别分配达成一致,则会降低其权重”。这不完全正确。如果委员会正确地投票(与地面真相标签相比),则会降低权重。反之亦然,以增加权重。 –
好点。在帖子中更正。 – kitchenette
- 1. 在Matlab中使用支持向量机与支持向量机
- 2. 多支持对象分类支持向量机
- 3. 用于替代支持向量机
- 4. 多类支持向量机分类
- 5. 支持向量机简介
- 6. Scala支持向量机库
- 7. SVM(支持向量机)opencv
- 8. 支持向量机绘图
- 9. 支持向量机示例
- 10. Apache Spark支持向量机
- 11. 支持向量机插图
- 12. 支持向量机理解
- 13. Apache-Spark支持向量机
- 14. 支持向量机预测方法
- 15. 支持向量机和神经网络
- 16. 线性支持向量机与非线性支持向量机高维数据
- 17. 在python中使用支持向量机算法
- 18. 支持向量机算法是我的模型有效的
- 19. 计算支持向量机的边际和偏差
- 20. 支持向量机模型不支持概率估计?
- 21. 为什么支持向量在支持向量机中不会改变?
- 22. 关于adaboost算法
- 23. 支持向量机中的决策边界和权向量
- 24. scikit学习多类支持向量机的参数优化
- 25. 支持向量机matlab示例
- 26. 支持向量机的几何直觉
- 27. Sklearn支持向量机与Matlab SVM
- 28. sklearn支持向量机不学习
- 29. 在Android中实现支持向量机
- 30. 支持向量机一对一训练
为什么这被标记为Java? –
你有多少个数据点和功能?嘈杂,稀疏?我建议先从快速线性SVM [scikit-learn SGDClassifier](http://scikit-learn.org/stable/modules/sgd.html)开始。 – denis