ICMLMar, 2021
正负动量:利用随机梯度噪声来改善泛化
Positive-Negative Momentum: Manipulating Stochastic Gradient Noise to Improve Generalization
Zeke Xie, Li Yuan, Zhanxing Zhu, Masashi Sugiyama
TL;DR提出了一种 Positive-Negative Momentum (PNM) 方法来模拟随机梯度噪声 (SGN) 并代替传统的动量方法,通过将两个近似独立的动量项的差异调整来显式控制 SGN 的大小,理论上证明了 PNM 相比于 SGD 的收敛保证和泛化优势,并在将 PNM 应用于 SGD 和 Adam 两个传统优化器后,实验证明了 PNM 优化器的巨大优势。