在多个出版物中描述这个问题涉及在CNN使用位置矢量的关系分类,如以下通过Zeng等人:http://www.aclweb.org/anthology/C14-1220创作卷积神经网络的位置矢量的关系分类
我想在张量流中实现这样一个模型。我的问题如下:
使用随机初始化向量表示位置信息有什么好处吗?举例来说,为什么不用一个热门的矢量编码来表示位置?不建议将单热矢量与密集的单词矢量结合起来吗?
根据单词向量的维度,位置向量应该具有最小维度吗?例如,假设单词向量维数为500,那么对于位置向量来说,维数10是否会太小而不能在模型中有效?是否有一系列已知的位置向量表现良好的维度?
用于编码位置信息的随机初始化向量之间的距离是否重要?
非常感谢您花时间研究这一点!