Aug, 2023

自适应Polyak步长和线性搜索的SGD算法:稳健收敛和方差降低

TL;DR该研究提出了两种新的变体的随机Polyak步长和随机线性搜索算法,名为AdaSPS和AdaSLS,它们保证了在非插值设置下的收敛,并在训练超参数化模型时维持凸函数和强凸函数的次线性和线性收敛速度。此外,通过引入方差缩减技术,这些算法能够在次优情况下进行梯度评估,达到O(ε)次优性,从而改进了非插值区域AdaSPS和AdaSLS的较慢O(1/ε^2)收敛速度。实验验证了算法的理论有效性和稳健性。