关键词speculative sampling
搜索结果 - 5
- EAGLE-2:使用动态草稿树加速语言模型推理PDF12 days ago
- 优化的 GPU 硬件加速器的推测采样PDF20 days ago
- Chimera:融合所有令牌的无损解码方法用于加速大规模语言模型推理PDF4 months ago
- PaSS:并行推测采样PDF7 months ago
- 结合推测抽样和 KV-Cache 优化的基于 OpenVINO 的生成式人工智能技术的利用PDF8 months ago
Prev
Next