关键词retrieval-augmented language model
搜索结果 - 3
- 通过标记消除优化检索增强阅读模型
通过分析检索到的段落对阅读器模型性能的贡献和必要性,以及在令牌级别上消除一些可能对答案生成过程没有贡献的检索信息,我们证明了我们的方法能够在最多减少 62.2% 运行时间的同时,只有 2% 的性能下降甚至在某些情况下提高性能结果。
- 变色龙:一种用于检索增强语言模型的异构和解聚加速器系统
创建了一种名为 Chameleon 的异构加速器系统,利用分体架构整合了语言模型和信息检索加速器,实现了对于不同的 Retrieval-Augmented Language Model 系统需求的高效加速,并在性能上取得了显著的提升。
- FiDO:面向更强性能和更快推理优化的解码器融合
使用两项简单的变更加速 FiD 架构的推理速度,并允许更大的 Decoder。我们称具有以上修改的 FiD 为 FiDO,并表明它在各种推理预算范围内均表现出更好的性能。