Jan, 2024

大语言模型推理中的效率增强:专门解码的综合调查

TL;DR通过提出实例、讨论关键方面,总结了 Speculative Decoding 的定义、技术、挑战和未来方向,以加速 LLM 推理过程。