Jan, 2018

如何随机地使梯度变小:更快的凸优化和非凸优化随机梯度下降

TL;DR该研究分别设计了针对凸函数和非凸函数的优化算法 SGD3 和 SGD5,分别能够在近最优的速率下找到梯度范数为特定值的最小值点和近似局部极小值点,并且这些速率具有优越性和不劣性。