BriefGPT.xyz
Ask
alpha
关键词
optimal steps
搜索结果 - 1
相同和异构数据的本地随机梯度下降的更紧密理论
本文提出了一种新的 Local SGD 方法的分析方式,去掉了不必要的假设并详细阐述了同一和异构两种数据环境下的区别,对于这两种情况,我们提高了现有理论并提供了最优步长和最优本地迭代次数。我们的界限基于一种特定于不同数据的 Local SG
→
PDF
5 years ago
Prev
Next