BriefGPT.xyz
Ask
alpha
关键词
restricted uniform inequality of gradients
搜索结果 - 1
自适应随机梯度下降的线性收敛
本文证明了自适应随机梯度方法的规范版本(AdaGrad-Norm)在强凸函数或满足 Polyak Lojasiewicz 不等式的非凸函数的子集中,达到的收敛速度是线性的。文中引入了梯度的限制均衡不等式(RUIG)的概念,用来描述函数的景观
→
PDF
5 years ago
Prev
Next