Jul, 2023

非凸目标的 Adam 算法收敛性:放宽超参数和非遍历情况

TL;DR本论文通过探索超参数设置并应对非自回归收敛对实际应用的挑战,建立了 Adam 在非凸优化问题中的理论基础,包括精确定义自回归和非自回归收敛、对非自回归收敛的优势强调、可松弛选择超参数的弱充分条件确保自回归收敛、实现了 Adam 的近似确定自回归收敛速率,以及在 Polyak-Lojasiewicz (PL) 条件下函数值的非自回归收敛率。