KDDMay, 2023

锐度感知最小化的再探:锐度加权作为正则化项

TL;DR本文介绍了一种更通用的方法 WSAM 来提高神经网络的泛化能力,该方法结合了 Sharpness-Aware Minimization 的优点作为正则化项,并通过 PAC 和 Bayes-PAC 技术证明了其泛化上界。在公共数据集上的实验表明,WSAM 实现了泛化能力的提高,或者至少与原始优化器 SAM 及其变体相比具有高竞争力。