May, 2024

SambaNova SN40L:通过数据流和专家组合扩展 AI 的内存墙

TL;DR结合 Composition of Experts(CoE)、流数据流和三层内存系统解决了人工智能内存瓶颈的问题,并介绍了 Samba-CoE,一个包含 150 个专家和一万亿总参数的 CoE 系统,部署在 SambaNova SN40L Reconfigurable Dataflow Unit (RDU) 上,通过引入三层内存系统、专用的 RDU 网络和多个 RDU 插槽实现了速度提升,有效减少机器占用空间并加快模型切换时间。