ICMLMar, 2021

正负动量:利用随机梯度噪声来改善泛化

TL;DR提出了一种 Positive-Negative Momentum (PNM) 方法来模拟随机梯度噪声 (SGN) 并代替传统的动量方法,通过将两个近似独立的动量项的差异调整来显式控制 SGN 的大小,理论上证明了 PNM 相比于 SGD 的收敛保证和泛化优势,并在将 PNM 应用于 SGD 和 Adam 两个传统优化器后,实验证明了 PNM 优化器的巨大优势。