Oct, 2018

随机梯度下降法在递减步长下期望收敛速率的紧凑维度无关下限

TL;DR研究随机梯度下降法(SGD)在强凸目标函数上的收敛性,证明了 ICML 2018 和 2019 提出的降低步长的速率序列在每次迭代后的收敛速度与我们的下限相差不到 32 倍,为最优状态;该下限相较于现有工作大约高出了因子 775×d,其中 d 是维度。