BriefGPT.xyz
大模型
Ask
alpha
关键词
collective communications
搜索结果 - 2
ForestColl:异构网络纺织品上的高效集体通信
在现代 DNN 模型不断增大的同时,加速器之间的集体通信(allreduce 等)成为一个重要的性能瓶颈。在今天高度多样化和异构的网络结构下,设计高效的通信调度是具有挑战性的。本文提出了 ForestColl,一种为任何网络拓扑生成高效调度
→
PDF
5 months ago
TACOS:分布式训练拓扑感知集合算法合成器
本文介绍了 TACOS,一种自动化的拓扑感知集体算法合成器,可应用于任意输入网络拓扑结构,优化了通信效率,加速了 All-Reduce 算法,适用于分布式训练等领域。
PDF
a year ago
Prev
Next