BriefGPT.xyz
大模型
Ask
alpha
关键词
straggling workers
搜索结果 - 2
DropCompute:通过计算方差减少计算量的简单而稳健的分布式同步训练
本文提出了一种简单而有效的分散式方法,以减少工作人员之间的变化,从而提高同步训练的鲁棒性,并验证了这些结果。
PDF
a year ago
利用聚类和多消息通信的梯度编码
本文介绍了一种新的梯度编码(GC)方案,结合多消息通信(MMC)和聚类,以减少因服务器慢导致的迭代时间延长问题,其能有效提高平均完成时间并降低通信负荷。
PDF
5 years ago
Prev
Next