2017-03-17 41 views
1

我试图预测一个值。我能够预测何时使用我的实际目标值,这是几天,但我尝试预测使用该值的日志,这给我一个错误。我正在使用sklearn和随机森林。使用随机森林中的日志时出错Python

代码:

X = final_pressure_df.drop(['y', 'log_y', 'patient_id', 'wound_id'], axis=1) 
Y = final_pressure_df['log_y'] 

X_train, X_test, Y_train, Y_test = sklearn.cross_validation.train_test_split(X, Y, test_size=0.4, random_state=5) 

forest = RandomForestClassifier(criterion='entropy', n_estimators=200, max_depth=100, random_state=5) 

forest.fit(X_train, Y_train) 

错误:ValueError: Unknown label type: array([[ 3.91202301]

有人能帮助我吗?

回答

0

您需要回归而不是分类,因此请使用RandomForestRegressor。 当预测的变量是实值(浮点)时,分类将不起作用。即使在第一种情况下,当您预测天数时,使用回归仍然更有意义,因为您预测的是某个值,以及不是类/类别的天数。

+0

非常感谢,我走了试试! – bim1