通过利用大型语言模型作为查询重写器,并结合精心设计的指令,我们定义了四个重写的关键属性,提出了基于大型语言模型的查询重写方法。我们还介绍了 LLMs 的重写能力的提炼,并采用 “先重写后编辑” 的方法来处理初始查询重写。实验结果在 QReCC 数据集上表明,信息丰富的查询重写可以显著提高检索性能,特别是在检索器稀疏的情况下。
Oct, 2023
最近大规模语言模型能力的进步引发了对其评估的新浪潮,这篇研究工作通过在自然语言和形式语言之间的相互转换来验证大规模语言模型理解和生成结构化逻辑形式的能力,实验证明现今最先进的大规模语言模型在理解逻辑形式方面整体上接近人类水平,但在生成正确逻辑形式方面仍有改进的空间,使用大规模语言模型生成更自然的语言训练数据以增强小型模型的效果更好,同时结果还表明模型对不同形式语言表现出显著的敏感性,总体而言,形式化程度较低、更接近自然语言的形式语言对大规模语言模型更友好。
Jan, 2024
信息检索系统和大型语言模型的融合,包括关键方面,如查询重写、检索、重新排序和阅读器,在这一快速发展的研究领域中提供全面的概述和深入的见解。
Aug, 2023
该研究介绍了一个新的 Rewrite-Retrieve-Read 框架,该框架从查询重写的角度改进了检索增强方法,并通过强化学习调整该框架的策略模型,通过开放域 QA 等下游任务进行了验证。
May, 2023
通过统一搜索任务,大规模语言模型框架重新定义了传统的搜索栈,利用其强大的语言理解和推理能力,提高搜索结果质量并简化搜索系统。
通过与用户与搜索引擎的交互历史相关的上下文,我们提出了一种新颖且通用的方法,用于个性化输出,这对于理解用户当前的搜索背景以及他们历史上知道和关心的内容是必要的。我们验证了我们的方法在上下文查询建议的任务上优于几个其他 LLM 基准方法,生成了在上下文中更相关、个性化和有用的查询建议。
Nov, 2023
大型语言模型(LLMs)在信息检索方面的优化、模型幻觉、用户隐私等关键问题的研究。
大型语言模型可用于定量信息检索,以帮助数据分析任务,如贝叶斯模型的先验分布以及缺失数据的插补。我们提出了一个提示工程框架,将大型语言模型视为科学文献的潜在空间界面,并与其他已建立的方法进行比较。同时讨论了使用大型语言模型作为 “专家” 的影响和挑战。
Feb, 2024
多模态搜索系统结合图像和文本,通过增强匹配能力、推理能力和上下文感知的查询解析和重写,提供用户与其搜索意图自然有效的交互。在 Fashion200K 数据集上,我们引入了一种新颖的多模态搜索模型,并提出了结合大型语言模型的搜索界面,以实现与用户的对话式互动和上下文考虑的搜索体验的升级,为购物助手提供了类人交互和全面的搜索体验。
Apr, 2024
通过利用大型语言模型 (LLMs) 的升级力量,本研究关注于构建一个可作为用户与用户界面之间中介的框架,通过对自然文本输入进行彻底分析,有效地理解用户需求,使得精心设计的 LLM 引擎能够分类最可能的可用应用程序,识别所需的用户界面组件,并随后执行用户预期行为,从而将静态用户界面系统转变为高度动态和适应性强的解决方案,引入智能和响应式用户体验的新领域。这样的框架可以从根本上改变用户完成日常任务的方式,提高效率,并大大减少认知负荷。