Jan, 2024

EAGLE:推测抽样需要重新思考特征不确定性

TL;DREAGLE 是一个简单的框架,可以通过自下而上的特征级联操作实现大型语言模型(LLMs)的无损加速,且生成的文本分布与传统自回归解码相同。