Feb, 2023

利用稀疏性在剪枝神经网络中优化大模型训练

TL;DR本文提出利用稀疏子网络以优化内存利用和通信的方法来加速深度学习中的数据和层间并行算法,并将其融入 AxoNN,实验证明在 512 NVIDIA V100 GPU上,相比于 AxoNN,DeepSpeed-3D和 Sputnik,优化后的模型内存消耗减少了74%,总通信时间减少了40%,从而提供了34%的总体加速。