Sep, 2023

通过方差抑制增强对锐度感知优化

TL;DR通过利用损失函数的几何特性,尤其是最小值邻域的平坦特性,锐度感知最小化(SAM)提高了深度神经网络的泛化能力,而无需大规模增强数据。本文的创新方法通过方差抑制(VaSSO)稳定了对手,并证明了在模型无关任务中,包括图像分类和机器翻译中,VaSSO 相对于 SAM 的数值性能得到了提高。此外,实验证实 VaSSO 使 SAM 对高水平的标签噪声具有鲁棒性。