Jun, 2024

自适应梯度方法在细化平滑度和噪声假设下的收敛分析

TL;DR分析了 AdaGrad 在随机非凸优化中收敛速率,证明了存在优于 SGD 的收敛速度,并给出了收敛速率的上界和下界。