ICLRApr, 2022
一类带 AdaGrad 步长的非凸算法的高概率界
High Probability Bounds for a Class of Nonconvex Algorithms with AdaGrad Stepsize
Ali Kavis, Kfir Yehuda Levy, Volkan Cevher
TL;DR本文提出了一种新的简化的高概率分析 AdaGrad 的方法,并证明了它在光滑非凸问题中的收敛性,并且没有光滑度和方差知识。同时,我们在附加噪声假设下进一步证明了 AdaGrad 的噪声适应性。