Feb, 2024

利用前瞻解码打破 LLM 推断的顺序依赖性

TL;DR使用准确并行的预读解码算法加速大型语言模型的自回归解码,从而减少总解码步骤,提高解码速度并充分发挥现代加速器的并行处理能力。