Oct, 2019

深度神经网络的 Hessian 矩阵在训练过程中的渐近光谱

TL;DR本文讨论了 DNN 在梯度下降过程中的动态,并根据所谓的神经切向核(NTK)揭示了 DNN 代价函数海森矩阵的精确洞察力。我们证明,当 NTK 在训练过程中保持不变时,我们可以获得代价函数海森矩阵的渐近谱的完整特征描述。在所谓的平均场极限中,NTK 在训练过程中不固定,我们描述了代价函数海森矩阵的初始化时的前两个矩。