Oct, 2023
变色龙:一种用于检索增强语言模型的异构和解聚加速器系统
Chameleon: a Heterogeneous and Disaggregated Accelerator System for Retrieval-Augmented Language Models
Wenqi Jiang, Marco Zeller, Roger Waleffe, Torsten Hoefler, Gustavo Alonso
TL;DR创建了一种名为 Chameleon 的异构加速器系统,利用分体架构整合了语言模型和信息检索加速器,实现了对于不同的 Retrieval-Augmented Language Model 系统需求的高效加速,并在性能上取得了显著的提升。