Jun, 2018
循环神经网络的动态同态性和均场理论:门控在信号传播中扮演重要角色
Dynamical Isometry and a Mean Field Theory of RNNs: Gating Enables
Signal Propagation in Recurrent Neural Networks
TL;DR本文通过mean field理论和随机矩阵理论的结合,解析了recurrent neural networks中gating机制的信号传播机理,并通过最小化的多层感知器网络(minimalRNN)与RNN的对比,研究了它们的训练性能。提出了初始方案的动态等角分解,并通过语言建模任务,证明了最小RNN可以与LSTM或GRU等复杂网络相媲美。