May, 2024
克洛弗:基于连续知识的逐渐式轻量级猜测解码
Clover: Regressive Lightweight Speculative Decoding with Sequential Knowledge
Bin Xiao, Chunan Shi, Xiaonan Nie, Fan Yang, Xiangwei Deng...
TL;DRClover 是一种新的推理解码算法,将顺序知识融入并行解码过程中,提高了预测准确率和整体效率。实验证明,Clover 在 Baichuan-Small 和 Baichuan-Large 上分别比基准结果提高了最多 91% 和 146%,与之前效果最好的方法 Medusa 相比,在 Baichuan-Small 和 Baichuan-Large 上分别提高了最多 37% 和 57%。