BriefGPT.xyz
Ask
alpha
关键词
token tree verification
搜索结果 - 2
ProPD: 动态令牌树剪枝和生成用于 LLM 并行解码
提出了一种基于动态标记树修剪和生成的高效的大型语言模型(LLM)并行解码框架 ProPD,它通过提高并行性和效率来改进解码的性能和上下文关系维护问题,并在各种批量大小、序列长度和任务等方面最大化整体效率。在各种数据集、LLM 和批量大小上验
→
PDF
5 months ago
SpecInfer: 使用推测推理和令牌树验证加速生成式语言模型服务
本文介绍了 SpecInfer,一种使用预测推断和令牌树验证加速生成式大型语言模型推断的 LLM 服务系统,其使用多个小型语言模型共同预测 LLM 的输出,并使用一种新的基于树的并行解码机制验证所有候选的令牌序列的正确性。通过使用 LLM
→
PDF
a year ago
Prev
Next