NIPSMay, 2017

通过赌博训练深度网络而无需学习率

TL;DR本文提出一种基于投掷硬币的随机梯度下降(SGD)优化算法,相较于传统方法,该方法不需要任何学习率设置,不适应任何学习率,且在凸函数和拟凸函数中证明了其理论收敛性,并且在实验中优于其他主流 SGD 算法。