Jan, 2024

噪声适应(加速的)随机重球动量

TL;DR我们在光滑、强凸的设置中分析了随机重球 (SHB) 动量的收敛性,证明了当小批量大小大于某个阈值时,SHB 可以获得加速收敛率。特别地,在具有条件数 κ 的强凸二次函数中,SHB 伴随标准步长和动量参数具有 O (exp (-T/√κ) + σ ) 收敛率,其中 T 是迭代次数,σ^2 是随机梯度的方差。为了确保收敛到最小值,我们提出了一种多阶段方法,得到了一种噪声自适应的 O (exp (-T/√κ) + σ/T ) 收敛率。对于一般的强凸函数,我们利用 SHB 的均值解释和指数步长证明了一种噪声自适应的 O (exp (-T/κ) + σ^2/T ) 最小值收敛率。最后,我们实证了所提出算法的有效性。