Feb, 2023

利用稀疏性在剪枝神经网络中优化大模型训练

TL;DR本文提出利用稀疏子网络以优化内存利用和通信的方法来加速深度学习中的数据和层间并行算法,并将其融入 AxoNN,实验证明在 512 NVIDIA V100 GPU 上,相比于 AxoNN,DeepSpeed-3D 和 Sputnik,优化后的模型内存消耗减少了 74%,总通信时间减少了 40%,从而提供了 34%的总体加速。