AAAIDec, 2020

深入研究深度神经网络的 Hessian 特征谱及其在正则化方面的应用

TL;DR通过研究每层的 Hessian eigenspectrum,提出了一种基于 Hessian trace 的新的正则化方法,可以间接地迫使 Stochastic Gradient Descent 收敛到更平的最小值,从而提高了深学习模型的泛化性能。