Aug, 2023

通过预训练稳定 RNN 梯度

TL;DR通过本研究,我们证明预训练网络以实现本地稳定性在复杂结构的网络中是有效的,并提出了一种称为本地稳定条件(LSC)的理论,它能最小化对数据和参数分布的假设。我们的实验结果表明,通过预训练满足 LSC 的前馈和递归网络通常能够提高最终性能。这项研究为实现任意复杂度的网络的稳定性提供了一种方法,该方法可以在大型增强数据集的预训练之前作为附加步骤,也可以作为在分析上找到稳定的初始状态的替代方法。