Oct, 2024

分析Adam算法收敛性的综合框架:弥合与SGD的差距

TL;DR本研究针对现有Adam算法收敛性理论理解的局限性问题,提出了一个新颖的综合框架以分析其收敛特性。研究表明,在放宽的假设下,Adam在几乎确定的意义和\(L_1\)意义上均可实现渐近收敛,同时在样本复杂度上与SGD相似,具有重要的理论与实践意义。