Mar, 2020

Facebook 数据中心中的深度学习培训:大规模上下文系统设计

TL;DR本文介绍了 Facebook 在机器学习中使用的大规模推荐模型 (DLRMs),探讨了在模型规模和复杂性不断增加时,如何高效地扩展训练。为了解决这个问题,Facebook 设计了 Zion 平台,作为下一代大内存训练平台,由 CPU 和加速器组成。