Jan, 2019

SGD: 一般分析和改进速率

TL;DR提出 SGD 收敛的通用简单定理,该定理可描述与特定概率法相关的各种 SGD 变体的收敛性。该定理是第一次执行这种分析,大多数 SGD 的变体以前从未明确考虑过。论文依赖于最近引入的期望平滑性的概念,并不依赖于随机梯度方差的统一界限。