Feb, 2018

基于 Hessian 的大批量训练分析与对抗性鲁棒性

TL;DR本文探讨了通过 Hessian 算子和鲁棒优化来训练大批量神经网络的方法,并证明了大批量训练会将模型收敛到一个具有更高 Hessian 谱的点,而鲁棒训练可以在损失函数中偏向于平缓区域,从而达到鲁棒性。此外,实验和理论证明了鲁棒训练是一个大部分情况下不存在鞍点的优化问题。