Nov, 2018

超参数问题中最小权重范式模型不总是具有良好的泛化能力

TL;DR通过实证发现,自适应方法在深度神经网络的训练中相比随机梯度下降可以有更好的泛化能力,需要较少的调整,同时不一定得到更小的权重范数。