Mar, 2024

友好的锐度感知最小化

TL;DRSAM的关键组件有助于改进模型泛化性能,而F-SAM则通过移除全梯度成分并利用随机梯度噪声来进一步提高模型的泛化性能。