EMNLPOct, 2022

GA-SAM: 基于梯度强度的自适应锐度感知优化算法,以提高泛化能力

TL;DR本文从理论角度分析了局部最小值的平坦程度与模型泛化性能的关系,提出了基于梯度强度的自适应 Sharpness-Aware Minimization 算法(GA-SAM)来发现更具鲁棒性的平坦局部最小值,其在自然语言任务上的表现令人满意。