Jun, 2024

一个通用的尖锐感知最小化算法类

TL;DR最近,对于过参数化模型开发优化算法的兴趣不断增加,因为普遍认为实现泛化需要具有适当偏差的算法。本文针对仅考虑少数尖锐度测量值的文献提出了新的尖锐度测量方法,并证明了这些测量方法的普遍表达性,以及它们如何对模型的参数不变性有着显著的影响。此外,本文还提出了Frob-SAM和Det-SAM两种特定设计的具体优化框架,并通过大量实验证明了该框架的优势。