Mar, 2024

深度神经网络的高效并行计算中的循环数据并行

TL;DR通过 Cyclic Data Parallelism 和 Model Parallelism 技术,在训练大型深度学习模型的过程中,减少了内存的需求以及 GPU 的使用,提升了模型的执行效率。