BriefGPT.xyz
大模型
Ask
alpha
关键词
draft models
搜索结果 - 2
迈向快速多语言 LLM 推断:投机式解码和专业的起草机
大语言模型在自然语言处理中产生了革命性的作用,并且扩展了它在不同商业应用中的适用性。然而,这些模型在多语言环境中的部署受到推理时间的限制。为了缓解这一挑战,本文探讨了使用推测解码的助理模型的训练方法,其中助理模型用于草拟未来的令牌,并通过目
→
PDF
10 days ago
佩戴披风的 GliDe:一种简便的加速推测式解码方法
该研究介绍了两种改进的解码模型,GliDe 和 CaPE,以进一步提高冻结 LLM 的解码速度,并通过大量实验证明 GliDe 可以显著降低期望的解码延迟。
PDF
5 months ago
Prev
Next