BriefGPT.xyz
Ask
alpha
关键词
synchronous approach
搜索结果 - 1
Chimera: 用双向管道高效地训练大规模神经网络
本研究提出了一种名为 Chimera 的新型管道并行方案,采用双向管道以有效训练大型深度学习模型,该方法是一种同步方法,相对于异步方法更加收敛友好,相对于最新的同步并行方法,Chimera 可以将冒泡数量减少多达 50% 。在基于 Tran
→
PDF
3 years ago
Prev
Next