我试图解决一个二进制分类问题,其中80%的数据属于类x和20%的数据属于类y。我的所有模型(AdaBoost,神经网络和SVC)都预测所有数据都是类x的一部分,因为这是他们可以达到的最高精度。机器学习:移动Treshhold
我的目标是为类x的所有条目实现更高的精度,我不在乎有多少条目被错误地归类为类y的一部分。
我的想法是将模型中的条目放入类x中,然后将其放入类y中。
我该怎么做到这一点?有没有办法移动阈值,以便只有非常明显的条目被归类为类x?
我使用Python和sklearn
示例代码:
adaboost = AdaBoostClassifier(random_state=1)
adaboost.fit(X_train, y_train)
adaboost_prediction = adaboost.predict(X_test)
confusion_matrix(adaboost_prediction,y_test) outputs:
array([[ 0, 0],
[10845, 51591]])