2017-07-14 63 views

回答

0

一般来说,你可以这样做:

  1. 瓷砖产地批第一维由beam_size倍,包括输出(编码输出的关注和编码器的最终状态作为初始解码器州)。每个波束大小的重复样本被标注为beam_i。

  2. 完成解码的一个步骤并从每个beam_i的词汇大小输出中相应地获得顶部beam_size * 2索引和概率。

  3. 保留每个生成角色的先前概率,并用这些概率和从步骤2获得的最后概率计算平均概率,并获得顶部beam_size字符。

  4. 将遇到stop_decode符号的样本放入列表中,如果列表的长度达到每个beam_i的波束大小,则波束结束。

但它是一个有点过于抽象,因此你可以参考this (official) example寻求帮助。它由谷歌的Denny Britz执行。