信息检索系统 (IR) 是用户访问信息的关键工具,也是搜索引擎、问答系统和推荐系统等场景中被广泛应用的工具。本文综述了生成式信息检索 (GenIR) 的最新研究进展,涉及到生成式文档检索 (GR)、可靠响应生成以及 GenIR 系统的评估、挑战和未来前景。
Apr, 2024
信息检索系统和大型语言模型的融合,包括关键方面,如查询重写、检索、重新排序和阅读器,在这一快速发展的研究领域中提供全面的概述和深入的见解。
Aug, 2023
信息检索领域,自传统搜索开始已经发展得非常成熟,并且扩展到满足用户不同的信息需求。最近,大型语言模型在文本理解、生成和知识推理方面表现出了异常的能力,为信息检索研究打开了令人兴奋的新方向。大型语言模型不仅有助于生成式检索,还为用户理解、模型评估和用户系统交互提供了改进的解决方案。最重要的是,信息检索模型、大型语言模型和人类之间的相互作用形成了一个更强大的信息搜索技术范式。信息检索模型提供实时和相关的信息,大型语言模型提供内部知识,而人类在信息服务的可靠性方面起到了需求者和评估者的核心角色。然而,仍然存在一些重大挑战,包括计算成本、可信度问题、特定领域限制和伦理考虑。为了深入讨论大型语言模型对信息检索研究的变革性影响,中国信息检索界于 2023 年 4 月举办了一次战略研讨会,得出了有价值的见解。本文总结了研讨会的成果,包括对信息检索核心价值的重新思考、大型语言模型和信息检索的相互增强、一个新的信息检索技术范式的提出以及面临的挑战。
Jul, 2023
本文研究生成信息检索是否只是另一种趋势或者像有些人声称的那样,是检索的范式变革,需要新的度量标准,理论基础,评估方法,任务定义,模型,用户界面等来探讨。
Jun, 2023
通过调查信息检索和自然语言处理文献,识别生成式检索中的搜索任务和系统架构,开发相应的用户模型并研究其操作化,该文理论分析为生成式即时检索系统的评估提供了基础和新洞察。
Nov, 2023
信息检索技术是一个不断发展的领域,这篇论文综述了信息检索技术的演变,重点讨论大型语言模型在传统搜索方法与新兴答案检索范式之间的桥梁作用。借助 GPT-4 等大型语言模型的整合,响应检索和索引领域正在发生范式转变,从而使用户能够更直接地与信息系统进行互动并获得语境相关的回答。通过这一探索,我们希望揭示塑造这一发展历程的技术里程碑及未来可能的方向。
Feb, 2024
大型语言模型(LLMs)在信息检索方面的优化、模型幻觉、用户隐私等关键问题的研究。
通过综述 Generative Retrieval(GR)的关键发展、索引和检索策略和挑战,讨论了具有挑战性的生成查询质量、可学习文档标识符、可扩展性和多任务学习框架等未来研究方向,旨在为 GR 提供基础理解并激发信息检索领域的进一步创新。
Jun, 2024
这篇论文强调信息检索引擎在科学界日益重要,针对传统基于关键词的搜索引擎由于文章数量不断增多而效率低下的问题提出了解决方案,通过构建结构化记录和使用先进信息技术工具(包括可视化仪表盘),彻底改变研究人员访问和筛选文章的传统文本密集型方法。通过以 “传染病的再生数估计” 研究主题为核心的概念验证,使用调试过的大型语言模型自动创建结构化记录并填充后端数据库,以取代关键词。结果是一种新一代的信息检索方法,可通过此 https 网址访问。
该研究综述了新兴的信息系统中增强搜索和推荐领域中的生成式搜索和推荐模型,并从一个统一的角度总结了该领域的发展,提出了独特挑战、未解问题和未来发展方向,展望下一个信息需求模式。