Jun, 2024
ACCO:分布式 LLM 训练中隐藏通信的累积通信技术
ACCO: Accumulate while you Communicate, Hiding Communications in Distributed LLM Training
Adel Nabli, Louis Fournier, Pierre Erbacher, Louis Serrano, Eugene Belilovsky...
TL;DR我们提出了一种适用于大规模语言模型分布式训练的高效优化算法,可以减小通信成本,加速收敛速度,并且适应异构硬件。