RAG-Fusion：一种新的基于检索增强生成的方法

Jan, 2024

RAG-Fusion：一种新的基于检索增强生成的方法

RAG-Fusion: a New Take on Retrieval-Augmented Generation

Zackary Rackauckas

TL;DR通过评估新兴的 RAG-Fusion 方法，本研究发现 RAG-Fusion 通过生成多个查询、使用互惠评分对其进行重新排名并融合文档和得分，从多个角度对原始查询进行了上下文化，使其能够提供准确和全面的答案。然而，在生成查询与原始查询关联度不足时，部分答案可能偏离主题。该研究在人工智能和自然语言处理应用中取得了重大进展，并展示了全球和多行业背景下的转变。

Abstract

infineon has identified a need for engineers, account managers, and customers to rapidly obtain product information. This problem is traditionally addressed with retrieval-augmented generation (RAG) chatbots, but

infineon rag-fusion chatbots artificial intelligence natural language processing

发现论文，激发创造

检索增强生成模型评估：一项调查

Retrieval-Augmented Generation (RAG) 系统的评估和分析框架（RGAR）提供了一种基于可测输出和已建立真实性来系统分析 RAG 系统基准的方法，并讨论了当前基准的局限性和进一步研究的潜在方向。

May, 2024

混合 RAG：通过语义搜索和混合基于查询的检索器提高 RAG（召回增强生成）的准确性

基于 Retrieval-Augmented Generation (RAG) 方法，结合语义搜索技术，如稠密向量索引和稀疏编码器索引，以及混合查询策略，我们提出了 ' 混合 RAG' 方法。通过在 IR 数据集和 Generative Q&A 数据集上取得更好的检索结果并创造新的基准，我们进一步将这种 ' 混合 Retriever' 扩展到 RAG 系统，甚至超过 fine-tuning 性能。

Mar, 2024

评估 RAG-Fusion 与 RAGElo：自动基于 Elo 的框架

针对检索增强生成（RAG）问答系统的自动化评估中存在的领域特定知识虚构问题和公司内部任务缺乏标准基准的挑战，我们提出了一个综合评估框架，利用大型语言模型（LLM）生成基于真实用户查询和领域内文档的大规模合成查询数据集，使用 LLM 作为评判者对检索的文档和答案进行评级，评估答案的质量，并使用 RAGElo 的自动 Elo 竞赛对不同变体的检索增强生成（RAG）代理进行排名。

Jun, 2024

DuetRAG: 协作检索增强生成

提出了一种新颖的 “Collaborative Retrieval-Augmented Generation” 框架 DuetRAG，以同时整合领域微调和 RAG 模型，提高知识检索质量，从而提高生成质量。最后，在 HotPot QA 上展示了 DuetRAG 与专业人类研究人员的匹配。

May, 2024

RAG 不适用于企业

通过结合知识检索，改进大型语言模型的输出的准确性和相关性的检索增强生成（RAG）在企业中的实施面临数据安全、准确性、可扩展性和集成方面的挑战。本文探讨了企业 RAG 的独特需求，调查了当前方法和限制，并讨论了语义搜索、混合查询和优化检索的潜在进展。它提出了一个评估框架，以验证企业 RAG 解决方案的能力，包括定量测试、定性分析、消融研究和行业案例研究。该框架旨在帮助证明面向企业级安全、合规性和集成性能够提供准确性和相关性改进的目的构建的 RAG 架构的能力。本文总结了企业部署的含义、限制和未来研究方向。研究人员与行业合作伙伴之间的密切合作可能加速检索增强生成技术的开发和部署的进展。

May, 2024

大语言模型的检索增强生成：综述

大型语言模型（LLMs）在实际应用中仍面临幻觉、知识更新缓慢和答案透明度不足等挑战。检索增强生成（RAG）是指在 LLMs 回答问题之前从外部知识库中检索相关信息。该论文概述了 LLMs 时代 RAG 的发展范式，总结了三种范式：Naive RAG，Advanced RAG 和 Modular RAG。同时，它提供了 RAG 的三个主要组成部分：检索器、生成器和增强方法的摘要和组织，以及每个组件的关键技术。此外，论文讨论了如何评估 RAG 模型的有效性，并介绍了两种 RAG 的评估方法、重点指标和能力，以及最新的自动评估框架。最后，从垂直优化、水平可扩展性和 RAG 的技术堆栈和生态系统三个方面引入了潜在的未来研究方向。

Dec, 2023

大型语言模型的检索增强文本生成综述

Retrieval-Augmented Generation (RAG) 是一种合并检索方法和深度学习技术的方法，旨在通过动态整合最新的外部信息解决大型语言模型（LLMs）的静态限制，并通过使用真实世界的数据提供一种成本效益的解决方案来改进 LLMs 输出的准确性和可靠性。该研究将 RAG 范式分为四个类别，并从检索的角度提供了详细的视角，同时介绍了 RAG 的演进和领域的进展。此外，该论文还提出了针对 RAG 的评估方法，并提出了面临的挑战和未来的研究方向，旨在巩固现有的 RAG 研究，明确其技术基础，并突出其扩展 LLMs 的适应性和应用潜力。

Apr, 2024

基于检索辅助的人工智能生成内容：综述

人工智能生成内容（AIGC）发展已经通过模型算法的进展、可扩展的基础模型结构和大量高质量数据集的可用性得到促进。检索增强生成（Retrieval-Augmented Generation，RAG）作为一种范例，通过从可用数据存储中检索相关对象来增强 AIGC 结果，以提高准确性和鲁棒性。该论文综述了将 RAG 技术整合到 AIGC 场景中的现有工作，分类和总结了不同检索器和生成器的增强方法，概述了 RAG 在不同模态和任务中的实际应用，并提出了未来研究的潜在方向。

Feb, 2024

在检索增强生成中寻找最佳实践

通过研究现有的 RAG 方法及其潜在组合，我们提出了几种既能兼顾性能又能提高效率的 RAG 策略，并证明多模态检索技术能显著增强对视觉输入的问答能力，并使用 “检索即生成” 策略加速多模态内容的生成。

Jul, 2024

利用检索增强生成（RAG）揭示知识缺口

利用检索增强生成（RAG）模型揭示互联网上的知识空白的方法论，并通过模拟用户搜索行为，RAG 系统识别和解决信息检索系统中的空白。该研究展示了 RAG 系统在生成相关建议方面的有效性，准确率达到 93％。该方法可以应用于科学发现、教育增强、研究发展、市场分析、搜索引擎优化和内容开发等各个领域。研究结果突出了识别和理解知识空白以指导未来努力的价值。

Dec, 2023