May, 2024

视觉任务中二阶指数缩放优化器的统一平衡理论

TL;DR我们通过使用变量的二阶指数尺度(SMES)的潜在方法,提出了一种统一一阶优化器的可能方法。我们从反向传播开始,解决经典现象(如梯度消失和梯度爆炸),以及与数据集稀疏性相关的问题,引入了优化中的平衡理论。通过这个理论,我们认为可以在更广泛的推论下统一 SGD 和自适应优化器,在第一阶优化器的广义公式中采用变量移动指数尺度来实现平衡方法。我们对一些经典数据集和网络进行了测试,以确认不同平衡系数对整体训练过程的影响。