BriefGPT.xyz
Ask
alpha
关键词
parallel deep learning
搜索结果 - 1
利用稀疏性在剪枝神经网络中优化大模型训练
本文提出利用稀疏子网络以优化内存利用和通信的方法来加速深度学习中的数据和层间并行算法,并将其融入 AxoNN,实验证明在 512 NVIDIA V100 GPU 上,相比于 AxoNN,DeepSpeed-3D 和 Sputnik,优化后的
→
PDF
a year ago
Prev
Next