Aug, 2023

延迟随机梯度下降的普适性理解探究

TL;DR基于生成函数分析工具,我们研究了异步延迟 SGD 的泛化误差上界,结果表明异步延迟减少了延迟 SGD 算法的泛化误差。