Sep, 2023

ADAM 在非凸背景下的常数步长收敛性:一个简单的证明

TL;DR我们在非凸设置中对 ADAM 的常数步长版本进行理论分析,证明了步长达到几乎肯定的渐近收敛性所需的充分条件,并提供了在处理平滑的非凸函数时确定性 ADAM 达到近似临界性的运行时界限。