Apr, 2024

AntDT: 一种自适应的分布式培训框架用于领导者和延迟节点

TL;DR该论文提出了一个统一的分布式训练框架 AntDT,用于自适应解决分布式训练中的延迟问题,并通过实验证明其在训练效率方面的优势。