Nov, 2023

Adam 算法在无界梯度和仿射方差噪声下的高概率收敛性

TL;DR研究了自适应矩估计算法(Adam)在无约束非凸平滑随机优化中的收敛性,证明了 Adam 能够在很高的概率下以 $O (poly (log T)/√T)$ 的速率收敛到稳定点,不需要任何有界梯度假设和问题相关的先验知识来调整超参数,同时还研究了一个简化版本的 Adam 算法以适应噪声水平。