BriefGPT.xyz
Ask
alpha
关键词
lookahead decoding
搜索结果 - 1
利用前瞻解码打破 LLM 推断的顺序依赖性
使用准确并行的预读解码算法加速大型语言模型的自回归解码,从而减少总解码步骤,提高解码速度并充分发挥现代加速器的并行处理能力。
PDF
5 months ago
Prev
Next