BriefGPT.xyz
Ask
alpha
关键词
stepsize adjustment
搜索结果 - 1
AdaPlus: 将 Nesterov 动量和精确的步长调整与 AdamW 基础相结合
该研究提出了一种称为 AdaPlus 的高效优化器,它在 AdamW 基础上集成了 Nesterov 动量和精确的步长调整,结合了 AdamW、Nadam 和 AdaBelief 的优点,并且不引入任何额外的超参数。经过广泛的实验证明了 A
→
PDF
10 months ago
Prev
Next