Oct, 2023

通过启用中间层解码加速 LLM 推理

TL;DR我们的研究工作通过指令调整大型语言模型的推理过程,提升其效率同时保持生成质量,这是推广应用这类模型的重要一步。