0
我有2个不平衡的类,50000个样本和肯定在集合中出现%5。数据是二维的。sklearn,ExtraTreesClassifier混淆评分
的问题是,我使用ExtraTreesClassifier。 oob_score_看起来不错,但是当我审视F1得分与cross_validation.cross_val_score,我得到低值。我完全困惑,我的分类器是好的或垃圾。
from sklearn.ensemble import ExtraTreesClassifier
trees = ExtraTreesClassifier(bootstrap=true, oob_score=True,n_estimators=100,class_weight="auto")
for i in range(1, 101):
trees.set_params(n_estimators=i)
trees.fit(x,y)
print trees.oob_score_
它打印 0.919955 0.919353 0.919353 ...增加。
当我做一个
from sklearn import cross_validation as cval
cv = cval.StratifiedKFold(y, 2)
cval.cross_val_score(trees, x, y, scoring="f1", cv=cv)
结果是 阵列([0.01604747,0.01250169]) ,这是相当不好的。
有人能够启发我吗?提前致谢。
非常感谢。 – daria