- 超越相关性:评估和提升具备观点感知的检索模型
信息检索任务要求系统根据用户的信息需求识别相关文档。这项研究探讨了检索系统是否能够识别和回应查询的不同视角,以及利用几何特征改善检索系统的视角意识。
- 基于二进制符号索引的半参数检索
信息检索的研究领域逐渐扩大,从搜索服务发展为各种高级应用的关键组成部分。为了提高检索效率、成本效益和实时性,本文介绍了一种名为 Semi-parametric Vocabulary Disentangled Retrieval(SVDR)的 - 真实世界中检索系统的比较分析
使用先进的语言模型与搜索与检索系统进行整合的综合分析,目的是通过精确度和效率方面的性能评估和比较不同的最先进方法。该研究探索了包括 Azure Cognitive Search Retriever 与 GPT-4、Pinecone 的 Ca - 何时检索:教导 LLMs 有效利用信息检索
本文介绍了如何使用大型语言模型(LLMs)有效地学习使用现成的信息检索系统来回答问题时所需的附加上下文。通过在 PopQA 数据集上进行评估,我们展示了 Adapt-LLM 在使用所有问题的信息检索、仅使用 LLM 的参数存储器以及使用人气 - Sõnajaht: 定义嵌入和语义搜索用于反向词典创建
提出了一种基于信息检索的反向字典系统,使用现代预训练语言模型和近似最近邻搜索算法,应用于现有的爱沙尼亚语词汇资源,目的是通过引入语义搜索来增强和丰富该资源,并提供跨语言的反向字典功能。评估结果表明,在单语言设置下,该基于信息检索的语义搜索方 - 使用大型语言模型的知识图谱上的多跳问答
鉴于知识图谱,以多跳问题为基础评估语言模型在知识图谱中的问答能力,展示了基于信息检索和语义解析的方法能够具有竞争力的性能。
- CLARINET:为检索任务扩展语言模型以提问澄清问题
这篇研究论文介绍了 CLARINET,一种能够通过选择问题来最大化正确候选项准确性的系统,在信息检索环境中提出澄清问题的问题,相对于传统的启发式方法提高了 17% 的检索成功率,并相对于简单提示的大型语言模型提高了 39%。
- 从匹配到生成:生成式信息检索综述
信息检索系统 (IR) 是用户访问信息的关键工具,也是搜索引擎、问答系统和推荐系统等场景中被广泛应用的工具。本文综述了生成式信息检索 (GenIR) 的最新研究进展,涉及到生成式文档检索 (GR)、可靠响应生成以及 GenIR 系统的评估、 - 多类量子卷积神经网络
使用 PennyLane 实现的量子卷积神经网络(QCNN)通过参数化量子电路优化来最小化交叉熵损失,用于经典数据的多类分类,在 MNIST 数据集上的实验结果表明,对于 4 类问题,性能略低于经典 CNN,但对于更多类别的问题,量子卷积神 - De-DSI: 分散可微搜索索引
De-DSI 是一种新颖的框架,通过将大型语言模型(LLMs)与信息检索真正的分布式化相结合,特别是在分布式环境中采用可微分搜索索引(DSI)的概念,以有效地将新颖的用户查询与文档标识符连接起来,在仅使用查询 - 文档标识符对上进行操作。该 - 多语言语义文本关联度评估
通过挖掘句子之间的深层联系,我们在马拉地语、印地语、西班牙语和英语中探索了语义文本相关性(STR),以在各种学习范式中利用不同的语言模型。结果表明,我们的方法很有效,并且希望在多语言 STR 领域中,特别是对于资源匮乏的语言,继续激发进一步 - COLING实时搜索中的事件增强检索
提出了一种名为 EER 的新方法,该方法通过改进传统 EBR 的双编码器模型、引入对比学习和生成式事件三元组提取方案,以及相关学习实现事件关联查询编码器优化,提高了实时检索性能,有望为信息检索领域带来新的视角。
- 使用大型语言模型生成的相关判定预测查询性能
使用自动生成的相关判断将查询性能预测 (QPP) 分解为独立的子任务,通过判断排名列表中每个项目与给定查询的相关性来预测信息检索评估度量,并利用领先的开源大型语言模型 LLaMA 来提高 QPP 质量。
- FollowIR: 评估和教授信息检索模型遵循指导
现代大型语言模型具备跟随长而复杂的指令以完成各种用户任务的能力。本研究引入了数据集 FollowIR,其中包含了严格的指令评估基准以及用于帮助信息检索模型学习更好地遵循真实世界指令的训练集。我们的结果表明现有的检索模型未能正确地使用指令,只 - 增强乘机旅客体验:加拿大航空乘客权益聊天机器人
一项针对加拿大航空旅行业的研究,提出了一个机器人助手用于帮助旅客了解他们的权益,通过将复杂的用户输入分解为简单的查询,并从详细航空旅行规定文件中检索相关信息,并提供最相关的段落和链接,用户可用于自己的情况。该系统成功克服了解析复杂用户输入和 - 数字病理学中的基础模型与信息检索
该论文综述了数字病理学中基础模型、LLM、生成式人工智能、信息检索和基于内容的图像检索的最新技术
- RAT: 检索增强思维在长远生成中引发上下文感知推理
通过信息检索迭代修订思维链能够显著提高大型语言模型在长期生成任务中的推理和生成能力,同时极大地减少错误生成。
- 学习联合嵌入空间的三模态动作检索
LAVIMO 是一个三模态学习的创新框架,通过加入人类中心视频作为额外模态,有效地弥补了文本和动作之间的差距,利用特殊设计的注意机制促进了文本、视频和动作模态之间的增强对齐和协同效应,在多个与动作相关的跨模态检索任务中实现了最先进的性能。
- JMLR: 提升推理能力和专业问答能力的联合医疗语言模型和检索训练
通过在细调阶段共同训练信息检索系统和大规模语言模型,引入了一种创新方法 —— 共同医学 LLM 和检索训练(JMLR),以克服传统模型在处理医学问答任务方面面临的挑战,通过采用同步训练机制,JMLR 降低了对计算资源的需求,增强了模型利用医 - 基于大型语言模型的大规模网络搜索用户仿真
基于大型语言模型的用户模拟框架用于改善用户搜索行为分析和建模,通过生成大规模的用户配置文件可有效模拟大规模人类搜索行为,并提供了一个全新的数据集以促进信息检索领域的研究。