适应性检索增强生成的对话系统

Jul, 2024

Adaptive Retrieval-Augmented Generation for Conversational Systems

Xi Wang, Procheta Sen, Ruizhe Li, Emine Yilmaz

TL;DR本研究探讨了对话系统中是否每次响应都需要外部知识增强的问题，填补了以往研究中缺乏明确控制的空白。我们提出了RAGate模型，通过分析人类判断，预测对话场景中是否需要增强，以提高响应质量。实验结果表明，RAGate能有效识别对话系统中适合进行检索增强的响应，显著提升生成自信度和回答质量。

Abstract

Despite the success of integrating large language models into the development of Conversational Systems, many studies have shown the effectiveness of retrieving and augmenting external knowledge for informative responses. Hence, many existing studies commonly assume the always need for

发现论文，激发创造

自我反思：学习通过检索、生成和评论

通过检索和自我反思，Self-RAG框架提高了语言模型的质量和准确性，在多样任务中显著优于其他模型。

Oct, 2023

大语言模型的检索增强生成：综述

大型语言模型（LLMs）在实际应用中仍面临幻觉、知识更新缓慢和答案透明度不足等挑战。检索增强生成（RAG）是指在LLMs回答问题之前从外部知识库中检索相关信息。该论文概述了LLMs时代RAG的发展范式，总结了三种范式：Naive RAG，Advanced RAG和Modular RAG。同时，它提供了RAG的三个主要组成部分：检索器、生成器和增强方法的摘要和组织，以及每个组件的关键技术。此外，论文讨论了如何评估RAG模型的有效性，并介绍了两种RAG的评估方法、重点指标和能力，以及最新的自动评估框架。最后，从垂直优化、水平可扩展性和RAG的技术堆栈和生态系统三个方面引入了潜在的未来研究方向。

Dec, 2023

噪声的力量：为RAG系统重新定义检索

通过详细和批判性地分析信息检索组件对检索辅助生成系统的影响，本研究揭示了特定类型的文档对于有效的检索辅助生成提示公式所需的特征，发现包括不相关的文档能出乎意料地提高准确性超过30％。这些结果强调了需要开发专门策略来将检索与语言生成模型相结合，为未来研究奠定了基础。

Jan, 2024

基于 RAG 的对话系统生成建议问题的动态情境

通过利用动态背景，包括动态的少样本示例和动态检索到的上下文，该研究旨在开发一种建议问题生成器，实验证明动态背景方法能够产生比其他提示方法更好的建议问题。

Mar, 2024

通过精细检索增强和自我检查提升问答对话能力

通过引入细粒度检索扩充和自我验证等方法，我们在对话型问答系统中提出了一种具有检索增强生成能力的方法，通过协同工作的对话型问题精炼器、细粒度检索器和基于自我验证的回答生成器，实现了问题理解和相关信息获取，实验证明了我们方法在现有基准算法上的巨大优势，同时我们还发布了一个包含重组问题、关键词提取、检索段落及其有用性的中文对话型问答数据集，以促进对RAG增强的对话型问答的进一步研究。

Mar, 2024

揭示双重检索增强生成的理论分析与实践解决方案

使用检索增强生成（RAG）的方法将检索到的文本用于增强大型语言模型（LLM）。然而，研究显示RAG并不一致有效，甚至可能因检索到的文本含有噪声或错误而误导LLM，这表明RAG具有双重性，既有益又有害。本研究分离和形式化RAG的益处和害处，通过表征相似度来近似它们之间的差距，并建立它们之间的权衡机制，使其可解释、可量化和可比较。根据我们的理论，提出了一种实用的新方法X-RAG，在标记级别上实现纯LLM和RAG的协同生成，以保留好处和避免害处。基于OPT、LLaMA-2和Mistral的LLMs的实验表明了我们方法的有效性并支持了我们的理论结果。

Jun, 2024

在检索增强生成中寻找最佳实践

通过研究现有的 RAG 方法及其潜在组合，我们提出了几种既能兼顾性能又能提高效率的 RAG 策略，并证明多模态检索技术能显著增强对视觉输入的问答能力，并使用“检索即生成”策略加速多模态内容的生成。

Jul, 2024

RAGBench: 用于检索增强生成系统的可解释性基准测试

RAGBench是首个包含10万个有标签RAG系统实例的综合型大规模评估基准数据集，覆盖了五个独特的行业特定领域和各种RAG任务类型，并引入了可解释和可操作的RAG评估指标集TRACe。

Jun, 2024

自然语言处理中检索增强的生成模型：综述

大型语言模型和检索增强生成技术在各个领域取得巨大成功，但仍存在幻觉问题、知识更新问题和缺乏领域专长等关键问题。本文回顾了检索增强生成技术的显著技术，特别是在检索器和检索融合方面，并提供了教程代码以实现这些代表性技术。此外，本文讨论了检索增强生成技术的训练方法和应用，并探讨了其未来发展方向和挑战。

Jul, 2024

RAGLAB：一个模块化和面向研究的检索增强生成统一框架

本研究解决了检索增强生成（RAG）技术中对新算法缺乏全面公平比较以及现有开源工具透明度不足的问题。通过介绍RAGLAB，一个模块化的开源库，研究者可在10个基准上公平比较6种RAG算法，从而推动新算法和评估指标的发展。该框架的建立有望提升RAG方法的研究效率和成果。

Aug, 2024