May, 2023

具收敛性保证的非光滑优化的 Adam 家族方法

TL;DR研究了 Adam 族方法在非光滑优化尤其是在训练非光滑神经网络方面的收敛性,提出了一个采用双时间尺度更新方案的新颖框架并证明了其在温和假设下的收敛性,介绍了一些植入了梯度剪切技术的随机次梯度方法并通过实验证明其高效性和健壮性。