Jul, 2023

递归神经网络的动态分析和特征值初始化器

TL;DR在本文中,我们通过权重矩阵的特征分解提出了一种分析循环神经网络中隐藏状态空间的新视角,解释了激活函数中的信息保存功能,基于特征分析为长期依赖提供了一个解释,并指出了回归任务和分类任务中特征值的不同行为。通过对训练良好的循环神经网络进行观察,我们提出了一种改良性能的新的循环神经网络初始化方法,在多个任务上胜过 Xavier 初始化器、kaiming 初始化器以及其他仅适用于循环神经网络的初始化器,如 IRNN 和 sp-RNN。