因此,我运行了一个SVM分类器(线性内核和概率为false),从具有大约120个特征和10,000个观测值的数据帧上sklearn。由于超出计算限制,该程序需要花费数小时才能运行,并且会一直崩溃。想知道这个数据帧是否可能太大?SVM的数据太多?
1
A
回答
0
2
总之没有,这不是太大的。线性svm可以进一步扩展。另一方面,libSVC库不能。好东西,即使在scikit-learn中你也有大规模的svm实现 - 基于liblinear的LinearSVC。您也可以使用SGD(也可以在scikitlearn中获得)来解决这个问题,它也将汇集更大的数据集。
0
该实现基于libsvm。拟合时间复杂度为 比样本数量多二次方,这使得难以将 缩放到具有多于10000个样本的数据集。
的官方数据大约sklearn svm告诉theshold是10,000个样本 所以SGD可能是一个更好的尝试。
相关问题
- 1. K-means和SVM的多数据
- 2. SVM的C++数据
- 3. Webservices:多少数据太多?
- 4. MongoDB - 多少数据太多数据?
- 5. 数据建模 - SVM
- 6. 太多的数据点
- 7. 阅读svm数据并重新训练更多数据?
- 8. PHPGraphlib太多数据点
- 9. 核心数据数据太多(一次)?
- 10. 调SVM短数据帧
- 11. 多少会话数据太多?
- 12. R中的空间数据:多类SVM的决策区域
- 13. Instagram的给予太多的数据
- 14. Rails的视图查看数据太多
- 15. $ nearSphere返回的数据太多
- 16. SQL查询返回的数据太多
- 17. 太多的数据库调用 - NHibernate
- 18. socket.io广播太多的数据包
- 19. 管理表中的太多列数据
- 20. symfony2中var_dump的数据太多doctrine2
- 21. asp.net gridview viewstate,太多的数据(溢出)
- 22. 太多的数据库连接mysql
- 23. 太多的数据库访问成本
- 24. 到数据源的连接太多
- 25. 太多的发布数据变量?
- 26. Feed算法+数据库:太多的行或太慢的检索
- 27. 太多的参数'
- 28. 高效的多类SVM包
- 29. 带Spark 1.6的多类SVM?
- 30. 在Matlab中的多类SVM
对于线性内核(至少对于LinearSVC;对于内核=线性的SVC不确定),应该是可以的。向我们展示代码! – sascha