May, 2024

克洛弗:基于连续知识的逐渐式轻量级猜测解码

TL;DRClover 是一种新的推理解码算法,将顺序知识融入并行解码过程中,提高了预测准确率和整体效率。实验证明,Clover 在 Baichuan-Small 和 Baichuan-Large 上分别比基准结果提高了最多 91% 和 146%,与之前效果最好的方法 Medusa 相比,在 Baichuan-Small 和 Baichuan-Large 上分别提高了最多 37% 和 57%。