May, 2023

锐度感知最小化的再探:锐度加权作为正则化项

TL;DR本文介绍了一种更通用的方法WSAM来提高神经网络的泛化能力,该方法结合了Sharpness-Aware Minimization的优点作为正则化项,并通过PAC和Bayes-PAC技术证明了其泛化上界。在公共数据集上的实验表明,WSAM实现了泛化能力的提高,或者至少与原始优化器SAM及其变体相比具有高竞争力。