2015-12-11 36 views
6

我试图预测一个时间序列:给定50个以前的值,我想预测5个下一个值。skflow回归预测多个值

为此,我使用的是skflow包(基于TensorFlow),并且此问题相对接近Boston example provided in the Github repo

我的代码如下:

%matplotlib inline 
import pandas as pd 

import skflow 
from sklearn import cross_validation, metrics 
from sklearn import preprocessing 

filepath = 'CSV/FILE.csv' 
ts = pd.Series.from_csv(filepath) 

nprev = 50 
deltasuiv = 5 

def load_data(data, n_prev = nprev, delta_suiv=deltasuiv): 

    docX, docY = [], [] 
    for i in range(len(data)-n_prev-delta_suiv): 
     docX.append(np.array(data[i:i+n_prev])) 
     docY.append(np.array(data[i+n_prev:i+n_prev+delta_suiv])) 
    alsX = np.array(docX) 
    alsY = np.array(docY) 

    return alsX, alsY 

X, y = load_data(ts.values) 
# Scale data to 0 mean and unit std dev. 
scaler = preprocessing.StandardScaler() 
X = scaler.fit_transform(X) 
X_train, X_test, y_train, y_test = cross_validation.train_test_split(X, y, 
    test_size=0.2, random_state=42) 
regressor = skflow.TensorFlowDNNRegressor(hidden_units=[30, 50], 
    steps=5000, learning_rate=0.1, batch_size=1) 
regressor.fit(X_train, y_train) 
score = metrics.mean_squared_error(regressor.predict(X_test), y_test) 
print('MSE: {0:f}'.format(score)) 

这导致:

ValueError: y_true and y_pred have different number of output (1!=5)

在训练结束。

当我试图预测,我也有同样的问题

ypred = regressor.predict(X_test) 
print ypred.shape, y_test.shape 

(200, 1) (200, 5)

因此,我们可以看到,该模型以某种方式预测只有1个,而不是5通缉值/希望。

如何使用相同的模型来预测多个值的值?

回答

6

我刚刚加入了对skflow的多输出回归支持,因为这个#e443c734,所以请重新安装这个包后再试一次。如果它不起作用,请跟进Github。

我还添加了多输出回归的一个例子examples folder

# Create random dataset. 
rng = np.random.RandomState(1) 
X = np.sort(200 * rng.rand(100, 1) - 100, axis=0) 
y = np.array([np.pi * np.sin(X).ravel(), np.pi * np.cos(X).ravel()]).T 

# Fit regression DNN model. 
regressor = skflow.TensorFlowDNNRegressor(hidden_units=[5, 5]) 
regressor.fit(X, y) 
score = mean_squared_error(regressor.predict(X), y) 
print("Mean Squared Error: {0:f}".format(score)) 
+0

感谢您将这个!它的工作原理:) – Julian

+1

我不认为这个代码工作了。当调用fit()时,会引发以下错误:'形状(?,1)和(?,2)不兼容。 (我使用的是'0.10.0rc0'版本)我还创建了一个关于这个问题的新问题:http://stackoverflow.com/questions/39192107/multiple-target-columns-with-skflow-tensorflowdnnregressor – twiz

+1

对此的任何回应题????!!!! – user40780