大型搜索模型:在 LLMs 时代重新定义搜索架构
本文提出了一种使用大语言模型的通用交互式查询重写框架,旨在提高透明性和意图理解能力,并改变传统的意图理解方法;在初步实验的支撑下,通过自然语言表达、交互和推理机器意图,取得了显著的排序性能提升。
Jun, 2023
将大型语言模型与搜索引擎服务相结合,为服务计算领域带来重大变革,本文深入研究了如何整合大型语言模型和搜索引擎以互惠互利。重点关注两个主要方面:使用搜索引擎改进大型语言模型 (Search4LLM) 和使用大型语言模型增强搜索引擎功能 (LLM4Search)。
Jun, 2024
这篇论文旨在研究大型语言模型的文档检索能力。实验表明,通过提供少量上下文演示,大模型可以直接生成正确答案的网址,相比于目前的检索方法在开放领域问答中表现更佳。
May, 2023
这篇论文介绍了一个严格设计的框架,用于创建能够有效锚定知识并采用闭环推理过程的大型语言模型,以提升其进行深入分析的能力,同时解剖了该框架的组成部分对模型性能的贡献,从而为改进推理能力提供了理论保证。
Nov, 2023
利用大型语言模型(LLM)的知识构建了一个新的生成检索框架,以提高相关性和直接回答搜索问题的能力,验证生成结果的可靠性和贡献来源的可信度,实现了在 LLM 时代的 “PageRank”。该框架包括生成器、验证器和优化器三个核心模块,分别关注生成可信任的在线来源、验证来源可靠性以及优化不可靠的来源。通过广泛的实验和评估,证明了我们方法在相关性、负责性和可信性上对多种最先进方法的优越性。
Oct, 2023
大型语言模型在自然语言理解、语言生成和复杂推理等重要任务中展示出了卓越的能力,并有潜力对我们的社会产生重大影响。然而,这些能力所需的资源相当可观,强调了开发有效的技术来解决其效率挑战的迫切需求。本调研以系统和全面的方式概述了高效大型语言模型的研究成果,从模型中心、数据中心和框架中心的角度,将文献进行了分类整理。我们还创建了一个 GitHub 存储库,在这个存储库中收集了本调研中涉及的论文,并将积极维护并整合新的研究成果。希望本调研能为研究人员和从业者提供有价值的资源,帮助他们系统地了解高效大型语言模型的研究进展,并激励他们为这个重要而激动人心的领域做出贡献。
Dec, 2023
利用大型语言模型(LLMs)开发了一个名为 GenSERP 的框架,该框架在少样本情况下利用 LLMs 与视觉功能来动态组织中间搜索结果,并根据用户查询生成一个连贯的搜索结果页面布局,提供出色的用户体验。
Feb, 2024
通过系统文献综述,我们深入研究了大型语言模型(LLMs)与软件工程(SE)的交叉领域,并特别关注 LLMs 在 SE 中的应用、影响和潜在局限。通过收集和分析 2017 年至 2023 年的 229 篇研究论文,我们回答了四个关键研究问题(RQs),比较分析了不同用于 SE 任务的 LLMs 的特点和用途,并详细描述了在此领域中数据收集、预处理和应用的方法,揭示了稳健、经过良好策划的数据集对于成功实施 LLM 的关键作用。同时,我们还调查了优化和评估 LLMs 在 SE 中性能的策略,以及与提示优化相关的常见技术。通过解决上述研究问题,我们勾勒出当前最先进的研究状况,找出现有研究的不足之处,并标注未来研究的有前景的领域。
Aug, 2023
本文分析了当前基础 LLM (ChatGPT) 与专门的预训练模型 (REBEL) 的联合实体和关系提取应用,以可持续发展文本为案例进行了多个实验,结果表明,使用先进的 LLM 模型可以提高从非结构化文本创建知识图谱的过程的准确性,并探索了使用基础 LLM 模型自动创建本体论的潜力,取得更相关和准确的知识图谱。
May, 2023