query latency | BriefGPT - AI 论文速递

关键词query latency

搜索结果 - 5

超越下游任务准确度的信息检索基准评估
本研究针对查找性能在用户面向场景下的部署需求，提出搜索引擎评估方法应包括准确率和效率，如查询延迟和对硬件环境的成本预算，以及结构评估方法应考虑到查找延迟、硬件成本等效率因素，为广义 IR 评价提供更全面的参考。
PDF2 years ago
通过上下文化的精确术语匹配和高效的片段扩展实现快速通道重新排名
提出了一种名为 TILDEv2 的新模型，该模型基于原始的 TILDE，但解决了其局限性，采用扩展的句子进行上下文化精确术语匹配，并将所得分数存储在索引中，生成的索引不到 TILDE 索引的 1％，且提高排名效果 24％，不影响查询延迟。它
PDF3 years ago
SIGIR文档内级联：学习选择用于神经网络文档排序的片段
采用基于知识蒸馏的 ESM 模型剪枝候选文档以减少计算量，从而降低了基于 ETM 模型的查询延迟并提高了检索效果。
PDF3 years ago
使用紧密耦合的教师将密集表示提炼为排名
通过知识蒸馏，将 ColBERT 中用于计算相关性分数的 MaxSim 操作的知识提取出来，应用于密集表示的排名方法中，从而提高了查询延迟并减少了 ColBERT 的存储开销。同时，将我们的密集表示与从文档扩展中导出的稀疏表示相结合，可以接
PDF4 years ago
SIGIR测量运行时间！扩展 IR 可重复性基础设施以包括性能方面
本文介绍了一种基于 Docker 的可重复性基础设施，旨在帮助神经信息检索领域更好地解决编码模型、网络架构、硬件加速等多种因素对性能和效果的权衡，并提出了两个基于性能的评价场景。
PDF5 years ago