Dec, 2019

自适应方法的领域无关主导性

TL;DR通过对自适应方法的简要分析,我们提出了 AvaGrad - 一种优化器,当其适应性调整得当时,其性能优于视觉任务中的 SGD。我们观察到我们方法的效果部分是由学习率和适应性的解耦实现,从而简化了超参数搜索。实践证明 AvaGrad 匹配了现有任何优化器(SGD 或自适应)在图像分类(CIFAR,ImageNet)和字符级语言建模(Penn Treebank)任务中提供的最佳结果。