Jun, 2020

随机梯度下降法和随机重球法的几乎必然收敛速率

TL;DR本文研究了随机梯度下降法和随机重球法在一般随机逼近问题上的收敛速度和最后迭代时的表现,证明了加权平均的迭代数的 收敛率,以及在非超参数区域内使用随机线性搜索和随机Polyak步进时的收敛性,并证明了最后一个重球的迭代收敛于极小化器,最后在非凸设置中证明了关于SGD轨迹下最低梯度范数的相似速率结果。