Jun, 2023

应用于深度学习的非凸随机 Bregman 近端梯度方法

TL;DR研究一系列随机 Bregman 近端梯度法(SBPG)方法,用于训练具有非 Lipschitz 梯度的非凸目标函数,及应用于神经网络训练中具有多项式内核函数的深度神经网络的优化算法。证明了 SBPG 及其动量版本(MSBPG)在非凸优化问题中有很好的收敛性,提出了 MSBPG 解决大规模优化中随机梯度下降法的一些不足。