Jan, 2022

Alpa:分布式深度学习的操作员内部和操作员间并行性自动化

TL;DRAlpa 是一个自动化生成深度学习(DL)大型模型的模型并行训练执行计划的系统,它利用数据、算子和流水线并行性来生成执行计划,实现了两个层次的并行性:算子内和算子间,并且通过编译器的优化自动得出高效的并行执行计划,并在分布式计算设备上进行了成功的评估。