ICMLJun, 2024

解密双倍随机梯度下降法

TL;DR对于以不可解期望的求和形式作为优化目标的问题,除了有界方差等强假设条件外,很少了解双重随机梯度下降(doubly SGD)的收敛性质。本研究在一般条件下,建立了具有独立小批量和随机重排的双重随机梯度下降的收敛性,并允许对依赖的分量梯度估计进行详细分析,推荐在每次迭代的计算预算中如何进行合理分配,同时证明随机重排(RR)可以改善子采样噪声的复杂度依赖关系。