Feb, 2024

基于偏差梯度估计的分布式动量方法

TL;DR通过对分布式动量法中的有偏梯度估计建立非渐近收敛界限,并且在元学习和压缩梯度等特殊情况下证明动量法在训练深度神经网络中比传统有偏梯度下降方法有更快的收敛性能。