2016-08-11 115 views
0

我有一个332栏的数据框。我想要推测价值,以便能够使用scikit-learn的决策树分类器。我的问题是从imputer函数所得到的数据的列仅330Scikit-learn Imputer缩小尺寸

from sklearn.preprocessing import Imputer 
imp = Imputer(missing_values='NaN', strategy='mean', axis=0) 
cols = data.columns 
new = imp.fit_transform(data) 

print(data.shape,new.shape) 
(34132, 332) (34132, 330) 
+0

你有没有全NaN色谱柱? –

+0

是的。这是我的答案。谢谢。 – jrlund

回答