0
什么是循环神经网络(RNN)中的变长序列输入的完整工作示例(不是片段)?你如何实现可变长度递归神经网络?
例如,PyTorch可以实现将可变长度序列作为RNN输入,但似乎没有完整工作代码的例子。
相关: https://github.com/pytorch/pytorch/releases/tag/v0.1.10 https://discuss.pytorch.org/t/about-the-variable-length-input-in-rnn-scenario/345
你写的部分不正确。 RNN旨在处理可变输入。它不是网络的限制,而是张量的限制(由pytorch设计)。如果您在每个训练步骤(通过批量大小= 1)进行单个样本,而无任何填充,则仍然可以将变量输入传递给pytorch中的RNN。如果你想处理一个微型批处理,填充会起作用,并且由于张量在技术上不可能有任何尺寸可变的尺寸,所以你必须使用填充。 – entrophy
这没有回答这个问题。显然,每个网站都支持将可变长度序列分为RNN:“nn.RNN,nn.LSTM,nn.GRU现在支持序列长度可变的小批量。” – mikal94305
递归神经网络中的变长输入并不是指每个样本的大小都是可变的,而是等长输入序列的大小是可变的。想象一下学习单词序列 - 您需要在切换到新句子时重置权重。句子可以是不同的长度 –