Jun, 2019

噪音和曲率之间的相互作用及其对优化和泛化的影响

TL;DR通过研究损失曲率和梯度方差的交互作用对优化速度的影响,本文探讨了两者相互作用如何影响优化速度,并阐明了曲率和噪声对于正确估计概括性差距的相关性质,同时区分了 Fisher 矩阵、Hessian 矩阵和梯度的协方差矩阵,以澄清现有作品的局限性。