如何重用MultiRNNCell中的权重？

我想创建一个新的MultiRNNCell，同时重新使用旧的权重。如何重用MultiRNNCell中的权重？

从创建MultiRNNCell时的TensorFlow 1.1开始，您必须明确地创建新的单元格。要重新使用权重，您必须提供reuse=True标志。在我的代码我目前有：

import tensorflow as tf 
from tensorflow.contrib import rnn 

def create_lstm_multicell(): 
    lstm_cell = lambda: rnn.LSTMCell(nstates, reuse=tf.get_variable_scope().reuse) 
    lstm_multi_cell = rnn.MultiRNNCell([lstm_cell() for _ in range(n_layers)]) 
    return lstm_multi_cell

当我创建第一个多细胞的功能，应该按预期工作，和多层元素内每个单元都有独立的重量和偏见。

with tf.variable_scope('lstm') as scope: 
    lstm1 = create_lstm_multicell()

现在我想创造另一个问题：

with tf.variable_scope('lstm') as scope: 
    scope.reuse_variables() 
    lstm2 = create_lstm_multicell()

我想第一个单元格从lstm2使用第一小区的重量和偏见从lstm1，第二小区重用重量和偏见的第二个单元格等，但我怀疑，因为我呼吁rnn.LSTMCell与reuse=True，权重&偏见的第一个细胞将一直重复使用。

如何确保重量正确重用？
如果他们不是，如何强制这种所需的行为？

P.S.由于架构原因，我不想重复使用lstm1，我想创建一个具有相同权重的新多节点lstm2。

来源

2017-05-12 Iakov Davydov

重用重量是什么意思？你想建立一个有状态的流程吗？ – dv3

@ dv3不，我不需要国家的LSTM。我只想让lstm1和lstm2表现相同，即多单元中每个单元的权重应该在lstm1和lstm2之间相同。 –

TL; DR

看来，在从细胞中的问题重量和偏见的代码将可以正常使用。多个小区lstm1和lstm2将具有相同的行为，并且MultiRNNCell内的小区将具有独立的权重和偏差。即在伪：

lstm1._cells[0].weights == lstm2._cells[0].weights 
lstm1._cells[1].weights == lstm2._cells[1].weights

加长版

这是至今没有一个明确的答案，但是这是研究我迄今所取得的结果。

它看起来像一个黑客，但我们可以覆盖get_variable方法来查看哪些变量被访问。例如像这样：

from tensorflow.python.ops import variable_scope as vs 

def verbose(original_function): 
    # make a new function that prints a message when original_function starts and finishes 
    def new_function(*args, **kwargs): 
     print('get variable:', '/'.join((tf.get_variable_scope().name, args[0]))) 
     result = original_function(*args, **kwargs) 
     return result 
    return new_function 

vs.get_variable = verbose(vs.get_variable)

现在我们可以运行下面的修改后的代码：

def create_lstm_multicell(name): 
    def lstm_cell(i, s): 
     print('creating cell %i in %s' % (i, s)) 
     return rnn.LSTMCell(nstates, reuse=tf.get_variable_scope().reuse) 
    lstm_multi_cell = rnn.MultiRNNCell([lstm_cell(i, name) for i in range(n_layers)]) 
    return lstm_multi_cell 

with tf.variable_scope('lstm') as scope: 
    lstm1 = create_lstm_multicell('lstm1') 
    layer1, _ = tf.nn.dynamic_rnn(lstm1, x, dtype=tf.float32) 
    val_1 = tf.reduce_sum(layer1) 

with tf.variable_scope('lstm') as scope: 
    scope.reuse_variables() 
    lstm2 = create_lstm_multicell('lstm2') 
    layer2, _ = tf.nn.dynamic_rnn(lstm2, x, dtype=tf.float32) 
    val_2 = tf.reduce_sum(layer2)

输出看起来像这样（我删除重复的线条）：

creating cell 0 in lstm1 
creating cell 1 in lstm1 
get variable: lstm/rnn/multi_rnn_cell/cell_0/lstm_cell/weights 
get variable: lstm/rnn/multi_rnn_cell/cell_0/lstm_cell/biases 
get variable: lstm/rnn/multi_rnn_cell/cell_1/lstm_cell/weights 
get variable: lstm/rnn/multi_rnn_cell/cell_1/lstm_cell/biases 
creating cell 0 in lstm2 
creating cell 1 in lstm2 
get variable: lstm/rnn/multi_rnn_cell/cell_0/lstm_cell/weights 
get variable: lstm/rnn/multi_rnn_cell/cell_0/lstm_cell/biases 
get variable: lstm/rnn/multi_rnn_cell/cell_1/lstm_cell/weights 
get variable: lstm/rnn/multi_rnn_cell/cell_1/lstm_cell/biases

此输出指示lstm1和lstm2单元格将使用相同的权重&偏差，两者都有分开权重&第一个偏差和MultiRNNCell内的第二个单元。

另外，val_1和val_2的输出lstm1和lstm2在优化期间是相同的。

我认为MultiRNNCell在其内部创建命名空间cell_0,cell_1等。因此，lstm1和lstm2之间的权重将被重新使用。

来源

2017-05-12 13:29:52

如何重用MultiRNNCell中的权重？

回答

相关问题