锐度感知最小化的再探：锐度加权作为正则化项

May, 2023

锐度感知最小化的再探：锐度加权作为正则化项

Sharpness-Aware Minimization Revisited: Weighted Sharpness as a Regularization Term

Yun Yue, Jiadi Jiang, Zhiling Ye, Ning Gao, Yongchao Liu...

TL;DR本文介绍了一种更通用的方法WSAM来提高神经网络的泛化能力，该方法结合了Sharpness-Aware Minimization的优点作为正则化项，并通过PAC和Bayes-PAC技术证明了其泛化上界。在公共数据集上的实验表明，WSAM实现了泛化能力的提高，或者至少与原始优化器SAM及其变体相比具有高竞争力。

Abstract

deep neural networks (DNNs) generalization is known to be closely related to the flatness of minima, leading to the development of sharpness-awar