检索增强型文本生成调查
Retrieval-Augmented Generation (RAG) 是一种合并检索方法和深度学习技术的方法,旨在通过动态整合最新的外部信息解决大型语言模型(LLMs)的静态限制,并通过使用真实世界的数据提供一种成本效益的解决方案来改进 LLMs 输出的准确性和可靠性。该研究将 RAG 范式分为四个类别,并从检索的角度提供了详细的视角,同时介绍了 RAG 的演进和领域的进展。此外,该论文还提出了针对 RAG 的评估方法,并提出了面临的挑战和未来的研究方向,旨在巩固现有的 RAG 研究,明确其技术基础,并突出其扩展 LLMs 的适应性和应用潜力。
Apr, 2024
本研究提出一种名为 Iter-RetGen 的方法,通过检索和生成的迭代协同作用,以全面地处理检索到的知识并在不受结构约束的情况下实现灵活的生成,而这可以在多跳问答、事实验证和常识推理等任务中实现可比甚至优于现有检索辅助基准的效果,同时减少检索和生成的开销,从而提高了性能。
May, 2023
我们提出了一种迭代检索 - 生成的协作框架,该框架可以利用参数化和非参数化知识,帮助找到正确的推理路径,并显著提高大型语言模型的推理能力。实验结果显示我们的方法优于之前的基线模型,在单跳和多跳问答任务上取得了显著的改进。
Oct, 2023
Retrieval-Augmented Generation (RAG) 系统的评估和分析框架(RGAR)提供了一种基于可测输出和已建立真实性来系统分析 RAG 系统基准的方法,并讨论了当前基准的局限性和进一步研究的潜在方向。
May, 2024
该论文提出了基于预测未来内容并利用其作为查询来检索相关文档的 Forward-Looking Active Retrieval augmented generation (FLARE) 方法,用以提高在生成长文本时控制语言模型虚构和不准确性的能力。测试证明,FLARE 在 4 个长篇知识密集型生成任务 / 数据集上表现优异,证明了该方法的有效性。
May, 2023
本文综述了检索多模态知识以辅助和增强生成模型的方法,并提供了对从外部来源(包括图像、代码、表格、图形和音频)检索根据的关注点的深入探讨,包括事实性、推理、可解释性和鲁棒性。
Mar, 2023
大型语言模型(LLMs)在实际应用中仍面临幻觉、知识更新缓慢和答案透明度不足等挑战。检索增强生成(RAG)是指在 LLMs 回答问题之前从外部知识库中检索相关信息。该论文概述了 LLMs 时代 RAG 的发展范式,总结了三种范式:Naive RAG,Advanced RAG 和 Modular RAG。同时,它提供了 RAG 的三个主要组成部分:检索器、生成器和增强方法的摘要和组织,以及每个组件的关键技术。此外,论文讨论了如何评估 RAG 模型的有效性,并介绍了两种 RAG 的评估方法、重点指标和能力,以及最新的自动评估框架。最后,从垂直优化、水平可扩展性和 RAG 的技术堆栈和生态系统三个方面引入了潜在的未来研究方向。
Dec, 2023
本文提出了一个名为 Selfmem 的框架,结合检索增强生成模型的原始和对偶问题,采用检索增强生成器自身进行迭代,以生成无限的记忆池,并使用记忆选择器来挑选下一代回合的记忆。在多个文本生成场景中进行了广泛的实验,并取得了 JRC-Acquis(四个方向),XSum(50.3 ROUGE-1)和 BigPatent(62.9 ROUGE-1)的最新成果。
May, 2023
给定具有文本属性的图,我们使用对话界面使用户能够与其图进行交流,在回答用户问题时提供文本回复并突出显示图的相关部分。通过开发我们的图问题回答(GraphQA)基准和集成 GNN、LLM 和 RAG 的 G-Retriever 方法,我们在多个领域的文本图任务中超越基准,而且可以适应更大的图大小并抗幻觉。
Feb, 2024