BriefGPT.xyz
Ask
alpha
关键词
medusa
搜索结果 - 1
Medusa: 多解码头简单的 LLM 推理加速框架
在这篇论文中,我们介绍了一种名为 Medusa 的方法,通过增加额外的解码头来预测并行的多个后续标记,从而提高 LLM 推理的效率,并减少所需的解码步骤。通过两个级别的精细调整程序,Medusa 可以满足不同用例的需求。此外,我们还提出了几
→
PDF
6 months ago
Prev
Next