May, 2024

长文本生成AI的统一序列并行算法

TL;DR通过比较序列并行性的通信和内存成本,本文提出了一种统一的序列并行性方法,适用于Transformer模型架构和网络硬件拓扑,实现了对长序列的生成AI模型的更好性能。