Mar, 2018

WNGrad: 梯度下降中的学习率学习

TL;DR我们提出了一种具有鲁棒性、适用于批量和随机梯度下降的学习率的非线性更新规则,该方法可实现基于梯度观察的学习率逐步降低,最终达到高效收敛。