提出了一个称为 LTRGR 的新框架,结合了生成式检索和经典的学习 - 排序模型,通过使用段落排名损失训练自回归模型,只需要额外的训练步骤即可增强当前的生成式检索系统,并在三个公共数据集上实现了最先进的性能。
Jun, 2023
信息检索系统 (IR) 是用户访问信息的关键工具,也是搜索引擎、问答系统和推荐系统等场景中被广泛应用的工具。本文综述了生成式信息检索 (GenIR) 的最新研究进展,涉及到生成式文档检索 (GR)、可靠响应生成以及 GenIR 系统的评估、挑战和未来前景。
Apr, 2024
通过综述 Generative Retrieval(GR)的关键发展、索引和检索策略和挑战,讨论了具有挑战性的生成查询质量、可学习文档标识符、可扩展性和多任务学习框架等未来研究方向,旨在为 GR 提供基础理解并激发信息检索领域的进一步创新。
Jun, 2024
通过调查信息检索和自然语言处理文献,识别生成式检索中的搜索任务和系统架构,开发相应的用户模型并研究其操作化,该文理论分析为生成式即时检索系统的评估提供了基础和新洞察。
Nov, 2023
TREC iKAT 2023 挑战中,本文使用 Generate-Retrieve-Generate 方法,利用大型语言模型(LLMs)进行答案生成与理解,通过 BM25 进行答案连贯性过滤,实现更高的性能表现。
我们提出了一种迭代检索 - 生成的协作框架,该框架可以利用参数化和非参数化知识,帮助找到正确的推理路径,并显著提高大型语言模型的推理能力。实验结果显示我们的方法优于之前的基线模型,在单跳和多跳问答任务上取得了显著的改进。
Oct, 2023
Re2G 利用神经检索和排名策略结合 BART 序列生成器,在零 - shot 填槽、问答、事实核查和对话等任务中取得了相对增益为 9% 至 34% 的较大提升,是目前 KILT 排行榜上最先进的模型。
Jul, 2022
信息检索系统和大型语言模型的融合,包括关键方面,如查询重写、检索、重新排序和阅读器,在这一快速发展的研究领域中提供全面的概述和深入的见解。
Aug, 2023
该研究论文介绍了一种统一的语言模型,通过将生成检索、闭书生成和 RAG 有机地结合,利用外部语料库处理各种知识密集型任务。该模型通过引入不同机制实现了有效的检索和生成,并在广泛使用的 KILT 基准测试中展现了出色的性能。
Feb, 2024
通过蒸馏技术,提出了一种名为 DGR 的可行框架,利用排名模型作为教师角色,通过专门设计的蒸馏 RankNet loss 来优化生成式检索模型,从而提升了当前生成式检索系统的性能。