Sep, 2023

通过梯度信噪比(GSNR)加速大批量训练

TL;DR基于梯度信噪比的方差缩减梯度下降技术对大批量任务进行了快速训练动态的理论分析和泛化分析,证明了其加速训练、缩小泛化差距和提高最终精度的效果。