2017-09-26 74 views
1

我对Tensor Flow比较陌生。此功能栏是什么以及它如何影响培训?Tensorflow-特征列

当我实现下面的代码时,这个数字列被创建为一个特性列。我想了解使用情况。

feature_columns = [tf.feature_column.numeric_column("x", shape=[1])] 

estimator = tf.estimator.LinearRegressor(feature_columns=feature_columns) 

x_train = np.array([1., 2., 3., 4.]) 
y_train = np.array([0., -1., -2., -3.]) 
x_eval = np.array([2., 5., 8., 1.]) 
y_eval = np.array([-1.01, -4.1, -7, 0.]) 

input_fn = tf.estimator.inputs.numpy_input_fn(
    {"x": x_train}, y_train, batch_size=4, num_epochs=None, shuffle=True) 
train_input_fn = tf.estimator.inputs.numpy_input_fn(
{"x": x_train}, y_train, batch_size=4, num_epochs=1000, shuffle=False) 
eval_input_fn = tf.estimator.inputs.numpy_input_fn(
{"x": x_eval}, y_eval, batch_size=4, num_epochs=1000, shuffle=False) 

estimator.train(input_fn=input_fn, steps=10000) 
train_metrics = estimator.evaluate(input_fn=train_input_fn) 
eval_metrics = estimator.evaluate(input_fn=eval_input_fn) 
print("\n\ntrain metrics: %r"% train_metrics) 
print("eval metrics: %r"% eval_metrics) 

回答

1

根据我从documentation on feature columns搜集,似乎它们用于某种输入数据功能转换成可以通过回归或神经网络模型中使用连续变量。

例如,在回归中,如果我们有一个分类变量,通常先将其转换为一组dummy variablestf.feature_column.indicator_column可以用来为我们做这个转换。然后我们可以在我们的feed字典中提供分类数据,并且转换为虚拟变量会在内部发生。

numeric_column的情况下,不需要这种转换,所以该课程基本上就像tf.placeholder一样。