Feb, 2021

PipeTransformer: 基于自动化弹性管道的 Transformers 分布式训练

TL;DR本研究提出了 PipeTransformer 来提高 Transformer 模型的多节点分布式训练效率,该方法通过自动化管线处理和数据并行来动态调整管线和并行策略,从而实现层的冻结和资源分配,结果表明 PipeTransformer 相较于现有算法可以提高 2.4 倍速度。