Dec, 2023

针对大型语言模型的前沿分布式训练优化

TL;DR通过实验结果和超参数调整,我们提出了一套用于大型语言模型的分布式训练策略。