我正在使用GridSearchCV和一个管道来分类索姆文本文档。代码片断插入下面获取对应的类predict_proba(GridSearchCV sklearn)
clf = Pipeline([('vect', TfidfVectorizer()), ('clf', SVC())])
parameters = {'vect__ngram_range' : [(1,2)], 'vect__min_df' : [2], 'vect__stop_words' : ['english'],
'vect__lowercase' : [True], 'vect__norm' : ['l2'], 'vect__analyzer' : ['word'], 'vect__binary' : [True],
'clf__kernel' : ['rbf'], 'clf__C' : [100], 'clf__gamma' : [0.01], 'clf__probability' : [True]}
grid_search = GridSearchCV(clf, parameters, n_jobs = -2, refit = True, cv = 10)
grid_search.fit(corpus, labels)
我的问题是使用grid_serach.predict_proba(new_doc)
时,然后要找出什么类的概率对应于具有grid_search.classes_
,我收到以下错误
AttributeError: 'GridSearchCV' object has no attribute 'classes_'
我有什么错过了什么?我认为如果管道中的最后一个“步骤”是一个分类器,那么GridSearchCV的返回也是一个分类器。因此可以使用该分类器的属性,例如classes_
谢谢先进!
完美!非常感谢 – AbtPst