ICLRApr, 2022

一类带 AdaGrad 步长的非凸算法的高概率界

TL;DR本文提出了一种新的简化的高概率分析 AdaGrad 的方法,并证明了它在光滑非凸问题中的收敛性,并且没有光滑度和方差知识。同时,我们在附加噪声假设下进一步证明了 AdaGrad 的噪声适应性。