Oct, 2023

SpecTr: 基于最优传输的快速推理解码

TL;DR通过将自回归抽样与猜测解码相结合,提出了一种理论上基于最优传输的规范解码方法,通过使用新的选择算法在保证解码质量的情况下获得解码速度的提升。