BriefGPT.xyz
大模型
Ask
alpha
关键词
distributed parallel training
搜索结果 - 1
IJCAI
更快的分布式深度神经网络训练:计算和通信解耦合的随机梯度下降
本文提出了 Computation and Communication Decoupling Stochastic Gradient Descent (CoCoD-SGD) 算法,实现了计算和通信的并行处理,有效减少了通信开销,较传统分布式
→
PDF
5 years ago
Prev
Next