Nov, 2024

一阶魔法:尖锐性意识最小化的分析

TL;DR本研究解决了尖锐性意识最小化(SAM)在提升模型泛化能力中的有效性理解不足的问题。我们提出SAM优化的修改目标,发现更精确的近似反而会降低泛化性能,提示SAM的泛化优势来源于这些近似,呼吁对近似在优化中的作用进行进一步研究。这个发现可能会引导新的优化技术开发,改善模型的应用性能。