Mar, 2018

通过傅里叶循环单元学习长期依赖关系

TL;DR本文提出了一种简单的循环神经网络架构,即傅里叶循环单元 (FRU),它稳定了训练中出现的梯度,同时为我们提供了更强的表现能力。具体而言,FRU 使用傅里叶基函数概括了沿时间维度的隐藏状态 $h^{(t)}$,使得由于残差学习结构和三角函数的全局支持,梯度可以轻松地到达任何层。我们还展示了 FRU 具有与时间维度无关的梯度下限和上限,以及得到 FRU 强表现力的稀疏傅里叶基的优势。我们的实验研究还表明,与其他循环架构相比,所提出的架构在许多任务上具有更少的参数且表现更好。