Dec, 2023

SANIA:Polyak类型优化框架导致尺度不变的随机算法

TL;DRSANIA是一个优化框架,通过自适应优化方法和预条件方法,解决了在训练深度神经网络中需要手动微调步长和处理问题缩放或病态的挑战。在分类任务中,包括凸和非凸情境下进行了广泛实证研究。