BriefGPT.xyz
Ask
alpha
关键词
universal convergence rates
搜索结果 - 1
具有动态拓扑和本地更新的去中心化 SGD 的统一理论
这篇论文介绍了一种统一的收敛性分析方法,涵盖了许多分散式随机梯度下降方法,具有计算成本低、数据本地性和沟通效率等优点,并包括本地随机梯度下降更新和自适应网络拓扑上的同步和成对传递更新,我们推导了光滑(凸和非凸)问题的通用收敛率,并在不同的数
→
PDF
4 years ago
Prev
Next