Jun, 2020

用于非凸联邦优化的随机梯度方法的统一分析

TL;DR本文研究了 SGD 变体在平滑非凸情况下的表现,并提出了一种通用的假设模型来精确建模随机梯度的二阶矩,并给出了所有满足统一假设的方法的单一收敛分析。此外,作者提出了两种新的通用算法框架来处理分布式 / 联邦非凸优化问题,并说明这些方法均满足他们的统一假设,因此这个统一的收敛分析也包括了许多利用压缩通讯的分布式方法。最后,文章提供了一种在 PL 条件下获得更快线性收敛速度的统一分析。