图检索增强生成:一项综述
我们介绍了RAGAs(检索增强生成评估)框架,用于无参考评估检索增强生成(RAG)流程,并提出一套可以用来评估不同维度的指标,而无需依赖于人工标注的真值,这对于RAG体系结构的快速评估是至关重要的,尤其是考虑到LLMs的快速采用。
Sep, 2023
大型语言模型(LLMs)在实际应用中仍面临幻觉、知识更新缓慢和答案透明度不足等挑战。检索增强生成(RAG)是指在LLMs回答问题之前从外部知识库中检索相关信息。该论文概述了LLMs时代RAG的发展范式,总结了三种范式:Naive RAG,Advanced RAG和Modular RAG。同时,它提供了RAG的三个主要组成部分:检索器、生成器和增强方法的摘要和组织,以及每个组件的关键技术。此外,论文讨论了如何评估RAG模型的有效性,并介绍了两种RAG的评估方法、重点指标和能力,以及最新的自动评估框架。最后,从垂直优化、水平可扩展性和RAG的技术堆栈和生态系统三个方面引入了潜在的未来研究方向。
Dec, 2023
使用图形增强生成(Graph RAG)方法结合知识源和查询集中的总结方法,能够在大规模语言模型中回答关于私人文档集合的全局问题,提高生成答案的完整性和多样性。
Apr, 2024
检视了检索增强型大型语言模型(RA-LLMs)的现有研究,涵盖体系结构、训练策略和应用三个主要技术视角,并介绍了此类模型的基础知识和最新进展,以及它们为大型语言模型(LLMs)带来的实际意义和应用领域的挑战和能力,最后讨论了当前的局限性和未来研究的几个有前途的方向。
May, 2024
Retrieval-Augmented Generation (RAG)系统的评估和分析框架(RGAR)提供了一种基于可测输出和已建立真实性来系统分析RAG系统基准的方法,并讨论了当前基准的局限性和进一步研究的潜在方向。
May, 2024
我们提出了FlashRAG,一个高效且模块化的开源工具包,旨在帮助研究人员在一个统一的框架内复现现有的Retrieval Augmented Generation方法,并开发自己的方法。工具包实现了12种先进的RAG方法,并收集和组织了32个基准数据集。
May, 2024
该研究提出了一种名为PG-RAG的预检索框架,使用大量阅读材料和结构化的语境记录来构建伪图数据库,该框架在单文档和多文档的问题回答任务中表现出明显的改进,具有高性能的检索和生成能力。
May, 2024
使用Pistis-RAG框架以及内容为中心的方法,通过改进排序阶段,提高了检索增强生成系统的性能,并且能够更好地对鲜为人知的UI交互进行建模以及处理。
Jun, 2024
Retrieval-augmented generation (RAG) has been enhanced with Think-on-Graph 2.0, aligning questions with knowledge graphs to improve information collection, integration, and precision, ensuring logical and factual consistency, advancing large language models' accuracy and reliability.
Jul, 2024
大型语言模型和检索增强生成技术在各个领域取得巨大成功,但仍存在幻觉问题、知识更新问题和缺乏领域专长等关键问题。本文回顾了检索增强生成技术的显著技术,特别是在检索器和检索融合方面,并提供了教程代码以实现这些代表性技术。此外,本文讨论了检索增强生成技术的训练方法和应用,并探讨了其未来发展方向和挑战。
Jul, 2024