May, 2024
SambaNova SN40L:通过数据流和专家组合扩展 AI 的内存墙
SambaNova SN40L: Scaling the AI Memory Wall with Dataflow and Composition of Experts
Raghu Prabhakar, Ram Sivaramakrishnan, Darshan Gandhi, Yun Du, Mingran Wang...
TL;DR结合 Composition of Experts(CoE)、流数据流和三层内存系统解决了人工智能内存瓶颈的问题,并介绍了 Samba-CoE,一个包含 150 个专家和一万亿总参数的 CoE 系统,部署在 SambaNova SN40L Reconfigurable Dataflow Unit (RDU) 上,通过引入三层内存系统、专用的 RDU 网络和多个 RDU 插槽实现了速度提升,有效减少机器占用空间并加快模型切换时间。