利用相关信息增益的改进RAG算法
大型语言模型(LLMs)在实际应用中仍面临幻觉、知识更新缓慢和答案透明度不足等挑战。检索增强生成(RAG)是指在LLMs回答问题之前从外部知识库中检索相关信息。该论文概述了LLMs时代RAG的发展范式,总结了三种范式:Naive RAG,Advanced RAG和Modular RAG。同时,它提供了RAG的三个主要组成部分:检索器、生成器和增强方法的摘要和组织,以及每个组件的关键技术。此外,论文讨论了如何评估RAG模型的有效性,并介绍了两种RAG的评估方法、重点指标和能力,以及最新的自动评估框架。最后,从垂直优化、水平可扩展性和RAG的技术堆栈和生态系统三个方面引入了潜在的未来研究方向。
Dec, 2023
通过详细和批判性地分析信息检索组件对检索辅助生成系统的影响,本研究揭示了特定类型的文档对于有效的检索辅助生成提示公式所需的特征,发现包括不相关的文档能出乎意料地提高准确性超过30%。这些结果强调了需要开发专门策略来将检索与语言生成模型相结合,为未来研究奠定了基础。
Jan, 2024
检索增强生成(RAG)通过为文档问答等任务提供额外的上下文大大提升了语言模型(LMs)的能力。在研究框架RAGGED下,我们研究了代表性的文档问答任务,观察了两种经典的稀疏和密集检索器以及四种在编码器-解码器和仅解码器架构中表现优异的LMs。研究结果显示,不同的模型适用于不同的RAG配置,而编码器-解码器模型在使用更多文档时呈现出单调改进,而仅解码器模型只能有效使用小于5个文档,尽管其上下文窗口通常更长。此外,RAGGED还揭示了LMs的上下文利用习惯,其中编码器-解码器模型更依赖上下文,并且对于检索质量更为敏感,而仅解码器模型则更倾向于依赖训练中记忆的知识。
Mar, 2024
整合外部知识到大型语言模型输出,文献调研主要集中于最新方法与之前方法的比较,缺乏广泛的实验比较。本研究通过评估不同检索增强生成方法对检索精度和答案相似性的影响来填补这一空白。研究发现,Hypothetical Document Embedding (HyDE) 和大型语言模型重排能显著提高检索精度。然而,Maximal Marginal Relevance (MMR) 和 Cohere 重排在基线 Naive RAG 系统上没有明显优势,而 Multi-query 方法表现不佳。句窗检索为最有效的检索精度方法,尽管在答案相似性上表现不稳定。研究证实文件摘要索引作为一种有效的检索方法。欢迎学术界进一步探索 RAG 系统的研究,相关资源可通过我们的 GitHub 资源库 ARAGOG 进行进一步调查。
Apr, 2024
通过改进文本检索过程,本文探讨了RAG管道的现有限制并引入了提升文本检索的方法,包括先进的文本切块技术、查询扩展、元数据注释的应用、重新排序算法以及嵌入算法的微调。通过实施这些方法可以大幅提高检索质量,从而提升LLM在处理和响应查询时的整体效果和可靠性。
Mar, 2024
Retrieval-Augmented Generation (RAG)是一种合并检索方法和深度学习技术的方法,旨在通过动态整合最新的外部信息解决大型语言模型(LLMs)的静态限制,并通过使用真实世界的数据提供一种成本效益的解决方案来改进LLMs输出的准确性和可靠性。该研究将RAG范式分为四个类别,并从检索的角度提供了详细的视角,同时介绍了RAG的演进和领域的进展。此外,该论文还提出了针对RAG的评估方法,并提出了面临的挑战和未来的研究方向,旨在巩固现有的RAG研究,明确其技术基础,并突出其扩展LLMs的适应性和应用潜力。
Apr, 2024
通过将外部知识库融入到Retrieval-Augmented Generation (RAG)中,提出了一种名为Dynamic-Relevant Retrieval-Augmented Generation (DR-RAG)的两阶段检索框架,用于改善文档检索的召回率和答案的准确性,同时保持高效性,通过对检索到的文档的贡献进行分类确定相对相关的文档,实验证明DR-RAG能显著提高答案的准确性,并在QA系统方面取得新的进展。
Jun, 2024
通过研究现有的 RAG 方法及其潜在组合,我们提出了几种既能兼顾性能又能提高效率的 RAG 策略,并证明多模态检索技术能显著增强对视觉输入的问答能力,并使用“检索即生成”策略加速多模态内容的生成。
Jul, 2024
通过生成多个查询来克服单一查询的信息平台以及通过重写问题来消除二义性,我们提出了Query Rewriter+来增强Query Rewriter模块,同时通过引入Knowledge Filter模块解决RAG系统中存在的无关知识问题,并且引入Memory Knowledge Reservoir和Retriever Trigger模块解决冗余检索问题,这四个RAG模块通过增强响应质量和效率,经实验证明了其有效性。
Jul, 2024
本研究解决了检索增强生成(RAG)系统中上下文窗口大小对生成质量的影响这一问题。通过系统实验,我们提出了一个新的超参数——上下文窗口利用,以优化文本块大小,平衡上下文信息的充分性与无关信息的最小化。研究结果表明,选择合适的文本块大小可以显著提升RAG系统的性能。
Jul, 2024