Jun, 2019
重尾梯度噪声下随机梯度下降的首次退出时间分析
First Exit Time Analysis of Stochastic Gradient Descent Under Heavy-Tailed Gradient Noise
Thanh Huy Nguyen, Umut Şimşekli, Mert Gürbüzbalaban, Gaël Richard
TL;DR本研究提出了一种新的视角来分析随机梯度下降,即将其作为一阶随机微分方程(SDE)的离散化,进而推导出了使得离散化后的系统与连续时间系统行为相似的步长条件,并分析了算法和问题参数对误差的影响。