Jan, 2019

LSTM和GRU的动态同构和平均场理论

TL;DR本研究使用平均场理论探究了LSTMs和GRUs中的信号传播,通过优化初始化超参数,开发出了一种新的初始化方案,解决了训练不稳定性问题,从而在多个序列任务上实现了成功的训练,并且在泛化能力上也有积极的影响。