2015-07-20 53 views
0

我有2个不平衡的类,50000个样本和肯定在集合中出现%5。数据是二维的。sklearn,ExtraTreesClassifier混淆评分

的问题是,我使用ExtraTreesClassifieroob_score_看起来不错,但是当我审视F1得分cross_validation.cross_val_score,我得到低值。我完全困惑,我的分类器是好的或垃圾。

from sklearn.ensemble import ExtraTreesClassifier 
trees = ExtraTreesClassifier(bootstrap=true, oob_score=True,n_estimators=100,class_weight="auto") 

for i in range(1, 101): 
    trees.set_params(n_estimators=i)  
    trees.fit(x,y) 
    print trees.oob_score_ 

它打印 0.919955 0.919353 0.919353 ...增加。

当我做一个

from sklearn import cross_validation as cval 
cv = cval.StratifiedKFold(y, 2) 
cval.cross_val_score(trees, x, y, scoring="f1", cv=cv) 

结果是 阵列([0.01604747,0.01250169]) ,这是相当不好的。

有人能够启发我吗?提前致谢。

回答