May, 2024
大型语言模型中的加速生成技术综述
A Comprehensive Survey of Accelerated Generation Techniques in Large Language Models
Mahsa Khoshnoodi, Vinija Jain, Mingye Gao, Malavika Srikanth, Aman Chadha
TL;DR这篇论文综述了大型语言模型中加速文本生成的关键技术,包括推测解码、提前退出机制和非自回归方法,并对它们的原理、优势、限制和最新进展进行了讨论,旨在为自然语言处理领域的未来研究方向提供指导。