关键词inference costs
搜索结果 - 13
- 内上下文格式:大型语言模型的快速压缩上下文PDF17 days ago
- CATS:大型语言模型中的上下文感知稀疏阈值PDF3 months ago
- SMART: 对于降低处理费用而言,自动缩减具有准确性保证的语言模型PDF4 months ago
- OSSCAR:一个用于图像和语言模型的单次结构化剪枝方法与组合优化PDF4 months ago
- Query-OPT: 通过多查询指令优化会议摘要中大型语言模型的推理PDF4 months ago
- 在小波域中的语音扩散模型加速:一种简单高效的方法PDF5 months ago
- 自适应计算模块:高效推理的细粒度条件计算PDF7 months ago
- 仅用于困难音频的大模型:高效推理的样本相关私语模型选择PDF9 months ago
- 通过选择性注意力进行推理成本降低的高级特征并行化PDFa year ago
- ICML函数空间内遍历模式以实现快速集成PDFa year ago
- 面向高效和可解释的自回归转换器的动态上下文剪枝PDFa year ago
- 批量提示:使用大型语言模型 API 进行高效推理PDFa year ago
- 当不应信任语言模型:探究参数式与非参数式记忆的有效性和局限性PDF2 years ago
Prev
Next