2017-12-27 884 views
0

因此Sci-kit学习的一些模型如Logistic回归支持我大量使用的predict_proba方法。对于像Lasso这样的模型,是否有其他方式输出类似的概率数组,因为它们不支持predict_proba?Sklearn - predict_proba等效

另外:我正在处理三个结果数据集,其中结果之间的概率可能相对均匀 - 任何有关模型/调谐以尝试提高概率精度的一般建议,可以处理50个以上的特征列? =)

谢谢!

回答

1

Sklearn介绍Probability calibration正是为了这个目的。在没有自然概率输出的情况下改进或增加对分类器的支持。

对此也有blog-post。使用将基于CalibratedClassifierCV

这两种方法,乙状结肠等渗,前者是背后LIBSVM的概率输出,你可以在sklearn的包装看到底层方法颇为流行SVC