Oct, 2023

变色龙:一种用于检索增强语言模型的异构和解聚加速器系统

TL;DR创建了一种名为 Chameleon 的异构加速器系统,利用分体架构整合了语言模型和信息检索加速器,实现了对于不同的 Retrieval-Augmented Language Model 系统需求的高效加速,并在性能上取得了显著的提升。