Feb, 2024

AdAdaGrad:自适应梯度方法的自适应批次大小方案

TL;DR通过使用自适应批次大小策略,引入了 AdAdaGrad 和 AdAdaGradNorm,在深度学习中展示了逐步批处理协议的提升适应性以及与自适应梯度优化器结合使用的自适应批次大小策略的潜力。