Nov, 2023

PaSS:并行推测采样

TL;DR通过使用并行解码,我们提出了一种使用单个模型从多个分词进行生成的方法,无需额外的计算成本或第二个模型,并表现出了令人期待的性能(最多可提高 30% 的速度),只需要最少 O (d_{emb}) 个附加参数。