BriefGPT.xyz
Oct, 2019
深度学习优化器的实证比较
On Empirical Comparisons of Optimizers for Deep Learning
HTML
PDF
Dami Choi, Christopher J. Shallue, Zachary Nado, Jaehoon Lee, Chris J. Maddison...
TL;DR
本文证明了优化器比较对超参数调整协议的敏感性,提出探究搜索空间是解释当前文献中最新动态排名的最重要因素之一,并展示实验结果证明了目前广泛使用的自适应梯度方法永远不会劣于动量或梯度下降。
Abstract
Selecting an
optimizer
is a central step in the contemporary
deep learning
pipeline. In this paper, we demonstrate the sensitivity of
optimizer
→