Oct, 2018
随机梯度下降法在递减步长下期望收敛速率的紧凑维度无关下限
Tight Dimension Independent Lower Bound on Optimal Expected Convergence
Rate for Diminishing Step Sizes in SGD
TL;DR研究随机梯度下降法(SGD)在强凸目标函数上的收敛性,证明了ICML 2018和2019提出的降低步长的速率序列在每次迭代后的收敛速度与我们的下限相差不到32倍,为最优状态;该下限相较于现有工作大约高出了因子775×d,其中d是维度。