Mar, 2025
分布式深度学习的自动操作级并行规划——混合整数规划方法
Automatic Operator-level Parallelism Planning for Distributed Deep
Learning -- A Mixed-Integer Programming Approach
TL;DR本研究解决了当前分布式深度学习中的并行化规划问题,尤其是在处理复杂非线性架构时的挑战。通过将并行规划形式化为调度优化问题并采用混合整数规划方法,提出了一种双层解决框架,能够自动生成有效的分布式计划。实验表明,该框架在计算效率上优于现有专家设计的策略,显著降低了计算瓶颈,具有良好的实际应用价值。