ICLRAug, 2016

SGDR: 带有热重启的随机梯度下降

TL;DR本篇论文提出了一种针对随机梯度下降的简单热重启技术,以提高训练深度神经网络的任意性能,并在 CIFAR-10 和 CIFAR-100 数据集上证明了其优越的表现。