2016-06-28 44 views
3

我想使用TensorFlow的梯度下降优化器来解决二维Rosenbrock函数,但是当我运行该程序时,优化程序有时会走向无穷大。有时候,没有改变任何东西,它可以找到合适的邻居,但不能找出最佳的解决方案。如何使用TensorFlow梯度下降优化器来解决优化问题

我的代码如下:

import tensorflow as tf 

x1_data = tf.Variable(initial_value=tf.random_uniform([1], -10, 10),name='x1') 
x2_data = tf.Variable(initial_value=tf.random_uniform([1], -10, 10), name='x2') 

y = tf.add(tf.pow(tf.sub(1.0, x1_data), 2.0), 
tf.mul(100.0, tf.pow(tf.sub(x2_data, tf.pow(x1_data, 2.0)), 2.0)), 'y') 

opt = tf.train.GradientDescentOptimizer(0.0035) 
train = opt.minimize(y) 

sess = tf.Session() 

init = tf.initialize_all_variables() 
sess.run(init) 

for step in xrange(200): 
    sess.run(train) 
    if step % 10 == 0: 
     print(step, sess.run(x1_data), sess.run(x2_data), sess.run(y)) 

的的ROSENBROCK问题被定义为y =(1 - X1)^ 2 + 100 *(X2 - X1^2)^ 2,在给予的最佳解决方案x1 = x2 = 1

我在做什么错?或者我完全误解了如何使用TensorFlow?

回答

4

如果您减少初始x1/x2的变化(例如使用-3/3而不是-10/10)并将学习速率降低10倍,则不应该经常发生爆炸。当你看到事物分歧时,降低学习率通常是一件好事。

此外,你优化功能对暂时难以找到全局最低制成,所以没有惊喜那里,它找到的山谷,但不是全局最优;)

3

是的,像@etarion说,这是一个优化问题,你的TensorFlow代码很好。

的一种方式,以确保永不爆炸的梯度是夹在他们的范围[-10., 10.]例如:

opt = tf.train.GradientDescentOptimizer(0.0001) 
grads_and_vars = opt.compute_gradients(y, [x1_data, x2_data]) 
clipped_grads_and_vars = [(tf.clip_by_value(g, -10., 10.), v) for g, v in grads_and_vars] 

train = opt.apply_gradients(clipped_grads_and_vars) 
+0

啊限制搜索空间。我也在想,但不知道该怎么做。谢谢! –