Oct, 2023

缩小Adam迭代复杂度上界与下界之间的差距

TL;DR本文通过导出Adam的新收敛保证来推翻现有Adam收敛的下界,并且证明当使用适当的超参数时,Adam满足一阶优化器的下界和上界,为Adam的收敛性建立了严密的上界。