WeKnow-RAG：一种适应性检索增强生成的方法，整合网页搜索与知识图谱

Aug, 2024

WeKnow-RAG：一种适应性检索增强生成的方法，整合网页搜索与知识图谱

WeKnow-RAG: An Adaptive Approach for Retrieval-Augmented Generation Integrating Web Search and Knowledge Graphs

Weijian Xie, Xuefeng Liang, Yuhui Liu, Kaihua Ni, Hong Cheng...

TL;DR本研究针对大型语言模型（LLMs）生成的事实错误和"幻影"内容问题提出了WeKnow-RAG方法，该方法结合网页搜索和知识图谱，以提高LLM的响应准确性和可靠性。通过多阶段网页检索技术，我们的方法显著提升了信息检索的效率和准确性，尤其在复杂推理任务上表现卓越，并能够自我评估生成回答的可信度。

Abstract

Large Language Models (LLMs) have greatly contributed to the development of adaptive intelligent agents and are positioned as an important way to achieve Artificial General Intelligence (AGI). However, LLMs are prone to produce factually incorrect information and often produce "phantom

发现论文，激发创造

大语言模型的检索增强生成：综述

大型语言模型（LLMs）在实际应用中仍面临幻觉、知识更新缓慢和答案透明度不足等挑战。检索增强生成（RAG）是指在LLMs回答问题之前从外部知识库中检索相关信息。该论文概述了LLMs时代RAG的发展范式，总结了三种范式：Naive RAG，Advanced RAG和Modular RAG。同时，它提供了RAG的三个主要组成部分：检索器、生成器和增强方法的摘要和组织，以及每个组件的关键技术。此外，论文讨论了如何评估RAG模型的有效性，并介绍了两种RAG的评估方法、重点指标和能力，以及最新的自动评估框架。最后，从垂直优化、水平可扩展性和RAG的技术堆栈和生态系统三个方面引入了潜在的未来研究方向。

Dec, 2023

多跳-RAG: 用于多跳查询的检索增强生成的基准测试

我们开发了一个新的数据集MultiHop-RAG，它由知识库、大量的多跳查询、它们的真实答案和相应的支持证据组成，并详细介绍了构建数据集的过程。我们进行了两个实验来展示MultiHop-RAG的基准化效用，实验结果表明现有的RAG方法在检索和回答多跳查询上表现不尽人意。我们希望MultiHop-RAG能成为开发有效的RAG系统的有价值资源，从而促进LLMs在实践中的更广泛应用。

Jan, 2024

关于 RAG 遇见 LLM 的调研：走向检索增强的大型语言模型

检视了检索增强型大型语言模型（RA-LLMs）的现有研究，涵盖体系结构、训练策略和应用三个主要技术视角，并介绍了此类模型的基础知识和最新进展，以及它们为大型语言模型（LLMs）带来的实际意义和应用领域的挑战和能力，最后讨论了当前的局限性和未来研究的几个有前途的方向。

May, 2024

通过自学使大型语言模型能够建立知识检索索引器

该研究提出了一种名为PG-RAG的预检索框架，使用大量阅读材料和结构化的语境记录来构建伪图数据库，该框架在单文档和多文档的问题回答任务中表现出明显的改进，具有高性能的检索和生成能力。

May, 2024

Pistis-RAG: 一种可扩展的层级框架用于可信的检索增强生成

使用Pistis-RAG框架以及内容为中心的方法，通过改进排序阶段，提高了检索增强生成系统的性能，并且能够更好地对鲜为人知的UI交互进行建模以及处理。

Jun, 2024

提升检索和管理检索：用于RAG系统质量和效率的四模块协同

通过生成多个查询来克服单一查询的信息平台以及通过重写问题来消除二义性，我们提出了Query Rewriter+来增强Query Rewriter模块，同时通过引入Knowledge Filter模块解决RAG系统中存在的无关知识问题，并且引入Memory Knowledge Reservoir和Retriever Trigger模块解决冗余检索问题，这四个RAG模块通过增强响应质量和效率，经实验证明了其有效性。

Jul, 2024

Think-on-Graph 2.0: 基于知识图引导的深度可解释大型语言模型推理

Retrieval-augmented generation (RAG) has been enhanced with Think-on-Graph 2.0, aligning questions with knowledge graphs to improve information collection, integration, and precision, ensuring logical and factual consistency, advancing large language models' accuracy and reliability.

Jul, 2024

自然语言处理中检索增强的生成模型：综述

大型语言模型和检索增强生成技术在各个领域取得巨大成功，但仍存在幻觉问题、知识更新问题和缺乏领域专长等关键问题。本文回顾了检索增强生成技术的显著技术，特别是在检索器和检索融合方面，并提供了教程代码以实现这些代表性技术。此外，本文讨论了检索增强生成技术的训练方法和应用，并探讨了其未来发展方向和挑战。

Jul, 2024

图检索增强生成：一项综述

本研究针对大型语言模型（LLMs）在生成过程中面临的信息过时、领域知识不足及“幻觉”等问题，提出通过图结构增强检索的创新方法——GraphRAG，旨在实现更精确的知识获取和上下文响应。该论文首次系统性梳理了GraphRAG的工作流程、核心技术和典型应用，提供了全面的学术参考和未来研究的方向。

Aug, 2024

RAGLAB：一个模块化和面向研究的检索增强生成统一框架

本研究解决了检索增强生成（RAG）技术中对新算法缺乏全面公平比较以及现有开源工具透明度不足的问题。通过介绍RAGLAB，一个模块化的开源库，研究者可在10个基准上公平比较6种RAG算法，从而推动新算法和评估指标的发展。该框架的建立有望提升RAG方法的研究效率和成果。

Aug, 2024