Oct, 2019

ZeRO: 面向训练万亿参数模型的内存优化

TL;DR本文描述了一种名为 ZeRO 的内存优化算法,可以有效地缩短大型深度学习模型的训练时间,并提高模型大小和通讯效率。该算法在 400 个 GPU 上训练了超过 1000 亿参数的大型模型,提供了比现有技术更高的性能和可用性。