Jun, 2023

稀疏扰动锐度感知极小化优化器的系统研究

TL;DR本文提出一种高效的 Sparse SAM 训练 scheme 来有效减少训练中的计算量,以达到平滑损失函数的目标,并提供了基于 Fisher information 和 dynamic sparse training 的两种不同的稀疏 mask 解决方案来实现稀疏干扰,理论证明了与 SAM 相同的收敛速度和有效性,并在 CIFAR 和 ImageNet-1K 上的实验证明了与 SAM 相比具有更好的效率和表现。