May, 2023

非凸目标函数的 AdaGrad 收敛性:简单证明和宽松假设

TL;DR本文提供了一种简单的收敛证明方法,证明了当仅有仿射噪声方差和有界光滑性假设时,AdaGrad 优化非凸目标,本文基于一个新的辅助函数 ξ 来消除处理 AdaGrad 更新的分子和分母之间的相关性的复杂性,与现有结果相比得到了更紧的结果,并将分析扩展到了若干个新的重要情况。