构建检索增强的生成式聊天机器人的相关事实

Jul, 2024

构建检索增强的生成式聊天机器人的相关事实

FACTS About Building Retrieval Augmented Generation-based Chatbots

Rama Akkiraju, Anbang Xu, Deepak Bora, Tan Yu, Lu An...

TL;DR基于我们对三个NVIDIA聊天机器人的经验，我们提出了一个构建基于RAG的聊天机器人的框架：包括FACTS框架、十五个RAG流水线控制点以及大型和小型LLMs之间精确度-延迟权衡的实证结果。据我们所知，这是第一篇提供了从综合视角看构建安全企业级聊天机器人的因素和解决方案的研究论文。

Abstract

enterprise chatbots, powered by generative ai, are emerging as key applications to enhance employee productivity. Retrieval Augmented Generation (RAG), Large Language Models (→

发现论文，激发创造

优化领域聊天机器人的RAG强化学习

通过采用基于 RAG 的 RL 优化方法，使用信息熵损失函数构建了一个使用 FAQ 数据回答用户查询的聊天机器人，该模型在检索准确性和领域外查询检测方面表现显著优于通用公开嵌入模型，同时能实现成本节省和细微的准确性改善。

Jan, 2024

RAG-Fusion：一种新的基于检索增强生成的方法

通过评估新兴的RAG-Fusion方法，本研究发现RAG-Fusion通过生成多个查询、使用互惠评分对其进行重新排名并融合文档和得分，从多个角度对原始查询进行了上下文化，使其能够提供准确和全面的答案。然而，在生成查询与原始查询关联度不足时，部分答案可能偏离主题。该研究在人工智能和自然语言处理应用中取得了重大进展，并展示了全球和多行业背景下的转变。

Jan, 2024

检索增强生成系统：自动数据集创建、评估和布尔代理设置

检索增强生成（RAG）系统在通过领域特定和时间敏感数据增强大型语言模型（LLM）输出方面非常受欢迎。本文提出了一种严格的数据集创建和评估工作流程，从而定量比较了不同的RAG策略，用于布尔代理RAG设置的开发和评估。我们在线发布了我们的代码和生成的数据集。

Feb, 2024

ERATTA：基于大型语言模型的表格问答极端阅读简化

我们提出了一种基于大型语言模型的系统，可以通过多个大型语言模型从各种规模大的企业级数据产品中提取信息，并在10秒内提供实时响应，同时提出了一个得分模块来检测和报告大型语言模型响应中的幻觉。在可持续发展、财务健康和社交媒体领域的数百个用户查询中，我们的系统和评分指标实现了超过90%的置信分数。

May, 2024

RAG 不适用于企业

通过结合知识检索，改进大型语言模型的输出的准确性和相关性的检索增强生成（RAG）在企业中的实施面临数据安全、准确性、可扩展性和集成方面的挑战。本文探讨了企业 RAG 的独特需求，调查了当前方法和限制，并讨论了语义搜索、混合查询和优化检索的潜在进展。它提出了一个评估框架，以验证企业 RAG 解决方案的能力，包括定量测试、定性分析、消融研究和行业案例研究。该框架旨在帮助证明面向企业级安全、合规性和集成性能够提供准确性和相关性改进的目的构建的 RAG 架构的能力。本文总结了企业部署的含义、限制和未来研究方向。研究人员与行业合作伙伴之间的密切合作可能加速检索增强生成技术的开发和部署的进展。

May, 2024

基于LLM的问答系统中检索组件的评估

评估大规模语言模型在问答系统中的检索组件性能的基线方法。

Jun, 2024

RAGBench: 用于检索增强生成系统的可解释性基准测试

RAGBench是首个包含10万个有标签RAG系统实例的综合型大规模评估基准数据集，覆盖了五个独特的行业特定领域和各种RAG任务类型，并引入了可解释和可操作的RAG评估指标集TRACe。

Jun, 2024

自然语言处理中检索增强的生成模型：综述

大型语言模型和检索增强生成技术在各个领域取得巨大成功，但仍存在幻觉问题、知识更新问题和缺乏领域专长等关键问题。本文回顾了检索增强生成技术的显著技术，特别是在检索器和检索融合方面，并提供了教程代码以实现这些代表性技术。此外，本文讨论了检索增强生成技术的训练方法和应用，并探讨了其未来发展方向和挑战。

Jul, 2024

汽车行业PDF聊天机器人的RAG技术优化：基于本地部署Ollama模型的案例研究

本研究针对汽车行业文件处理中的挑战，优化了在低性能本地环境中部署的大型语言模型（LLMs）的检索增强生成（RAG）技术。通过多维优化方法和定制化类别的设计，我们显著提高了PDF处理、检索机制和上下文压缩的效果，特别是在汽车行业文档的处理上取得了显著进展，为汽车行业的智能生产和信息处理提供了有效解决方案。

Aug, 2024

RAGLAB：一个模块化和面向研究的检索增强生成统一框架

本研究解决了检索增强生成（RAG）技术中对新算法缺乏全面公平比较以及现有开源工具透明度不足的问题。通过介绍RAGLAB，一个模块化的开源库，研究者可在10个基准上公平比较6种RAG算法，从而推动新算法和评估指标的发展。该框架的建立有望提升RAG方法的研究效率和成果。

Aug, 2024