Sep, 2023

AdaPlus: 将 Nesterov 动量和精确的步长调整与 AdamW 基础相结合

TL;DR该研究提出了一种称为 AdaPlus 的高效优化器,它在 AdamW 基础上集成了 Nesterov 动量和精确的步长调整,结合了 AdamW、Nadam 和 AdaBelief 的优点,并且不引入任何额外的超参数。经过广泛的实验证明了 AdaPlus 的有效性。