Jan, 2024

位置编码帮助递归神经网络处理大词汇量

TL;DR该研究讨论位置编码对递归神经网络(RNN)的影响,利用合成基准测试。位置编码在时间序列中 “时间戳” 数据点,并且补充了 Transformer 神经网络的能力,因为其缺乏表示数据顺序的内在机制。与此相反,RNN 可以自行对数据点进行时间信息编码,使其对位置编码的使用似乎显得 “冗余”。然而,实证调查结果表明,即使与 RNN 结合使用,在处理产生多样观察结果的大词汇量时,位置编码仍然有效。这些发现开辟了关于 RNN 的新的研究方向,涉及输入驱动和自主时间表征的组合。此外,还讨论了计算 / 仿真结果在生物学上的含义,以及位置编码的正弦实现和生物脑中的神经振荡之间的相似之处。