Jun, 2023

分散式 SGD 算法的稳定性和泛化分析改进

TL;DR本文提出 Decentralized Stochastic Gradient Descent 算法的泛化误差分析,并据此证明在凸设置下,不论选择哪种通信图,D-SGD 算法的泛化界限与经典 SGD 算法相同,即前人论述的通信图对泛化的不利影响并不成立。