May, 2023

UAdam: 非凸随机优化的统一 Adam 型算法框架

TL;DR我们介绍了一个统一的 Adam 型算法框架 (UAdam),并在非凸随机设置下对其进行了收敛性分析,证明 UAdam 以 $\mathcal {O}(1/T)$ 的速率收敛于传统的 Adam 型算法 (如 NAdam、AMSGrad、AdaBound、AdaFom 和 Adan) 的次局部最优解附近,其中,区域大小随着 β 的增加而减小。此外,我们还发现只需将一阶动量因子靠近 1 即可使得分析成立,为 Adam 型算法的进一步分析和应用提供了理论保证。