Oct, 2023

在线投机解码

TL;DR通过在线推理和训练预估模型,我们提出了一种在线推理预估解码技术,用于加速大型语言模型的推理过程,并减少延迟。