目前,我使用默认64作为seq2seq tensorflow模型的批量大小。什么是最大批量大小,图层大小等,我可以与一个单一的Titan X GPU与12GB RAM和Haswell-E xeon 128GB RAM一起使用。输入数据被转换为嵌入。以下是我使用的一些有用的参数,它看上去细胞输入尺寸为1024:如何确定seq2seq张量流RNN训练模型的最大批量大小
encoder_inputs: a list of 2D Tensors [batch_size x cell.input_size].
decoder_inputs: a list of 2D Tensors [batch_size x cell.input_size].
tf.app.flags.DEFINE_integer("size", 1024, "Size of each model layer.")
因此,基于我的硬件什么是最大批量大小,层,输入大小我能去吗?目前GPU显示占用了99%的内存。
目前GPU显示99%的内存被上面的配置占用。 – stackit
@stackit我发现TF'占据'整个GPU,即使它没有将它全部用于计算......如果你的模型超出了GPU内存限制,那么它会抛出一个错误,所以你可以找出你的最大模型大小通过试验和错误。 – j314erre