BriefGPT.xyz
Ask
alpha
关键词
distributed training algorithms
搜索结果 - 2
去中心化深度学习的本地异步随机梯度下降
本文主要介绍分布式深度神经网络训练算法的通信拓扑设计选择及异步去中心化算法如何通过 LASGD 实现模型同步,实验证明 LASGD 相较于 SGD 及业界领先的基于八卦协议的算法加速了大规模图像分类数据集 ImageNet 的训练速度。
PDF
2 years ago
ICML
规模安全分布式训练
本文提出了一种新颖的协议,用于安全的(拜占庭容错)分散式训练,强调通信效率。
PDF
3 years ago
Prev
Next