Mar, 2024

SDSAT:通过语义自适应标记的推理进行推测解码的加速

TL;DR通过引入具有语义自适应能力的令牌,提出一种用于大型语言模型(LLM)的加速方案(SDSAT)。该方案通过细调模型和使用训练方法,以及使用新的生成策略,能够在不影响模型准确性的情况下,提高模型生成草稿令牌的准确性,并且在 CodeLlama-13B 和 7B 模型上实验,分别获得了超过 3.5X 和 3.0X 的加速效果。