构建稳健的基于检索的摘要系统

Mar, 2024

Towards a Robust Retrieval-Based Summarization System

Shengjie Liu, Jing Wu, Jingyuan Bao, Wenyi Wang, Naira Hovakimyan...

TL;DR对大型语言模型（LLMs）在检索增强生成（RAG）式摘要任务中的鲁棒性进行了研究，提出了一种创新的评估框架 LogicSumm，通过现实场景评估 LLMs 在复杂的真实场景下的性能，并基于 LogicSumm 的限制提出了 SummRAG 系统，通过训练对话和模型微调来提高鲁棒性，实验证实了 SummRAG 的能力，展示了逻辑连贯性和摘要质量的提升。

Abstract

This paper describes an investigation of the robustness of large language models (LLMs) for retrieval augmented generation (RAG)-based summarizat

large language models retrieval augmented generation summarization robustness evaluation framework

发现论文，激发创造

用于医学教育中大规模非结构化文本数据的检索增强生成和代表性向量摘要化

本文讨论了检索增强生成模型在医学教育领域的应用，并提出了一种使用代表向量对大规模非结构化文本数据进行抽取和生成式摘要的方法。

Aug, 2023

在 BioLaySumm 中的 RAG-RLRC-LaySum：整合了检索增强生成和可读性控制，用于医学文本的通俗摘要

该论文介绍了 RAG-RLRC-LaySum 框架，通过先进的自然语言处理技术，使复杂的生物医学研究能够被非专业人士理解。我们的 RAG 解决方案借助重新排序方法利用多个知识源来确保准确性和相关性，同时我们的 RLRC 策略通过提高可读性使科学内容易于理解。在使用公开可访问的 PLOS 和 eLife 数据集进行评估时，我们的方法超过了 Plain Gemini 模型，读者易读性得分提高了 20%，ROUGE-2 相关性得分提高了 15%，事实准确性提高了 10%。RAG-RLRC-LaySum 框架能够有效地推广科学知识，促进公众对生物医学发现的参与。

May, 2024

关于 RAG 遇见 LLM 的调研：走向检索增强的大型语言模型

检视了检索增强型大型语言模型（RA-LLMs）的现有研究，涵盖体系结构、训练策略和应用三个主要技术视角，并介绍了此类模型的基础知识和最新进展，以及它们为大型语言模型（LLMs）带来的实际意义和应用领域的挑战和能力，最后讨论了当前的局限性和未来研究的几个有前途的方向。

May, 2024

基于检索增强生成的大型语言模型的基准测试

通过对 Retrieval-Augmented Generation 对大型语言模型的影响进行系统调查和评估，本文发现大型语言模型在噪音鲁棒性、负面拒绝、信息整合和对抗性鲁棒性方面存在挑战，表明在将 RAG 有效应用于大型语言模型方面仍有很长的路要走。

Sep, 2023

大语言模型的检索增强生成：综述

大型语言模型（LLMs）在实际应用中仍面临幻觉、知识更新缓慢和答案透明度不足等挑战。检索增强生成（RAG）是指在 LLMs 回答问题之前从外部知识库中检索相关信息。该论文概述了 LLMs 时代 RAG 的发展范式，总结了三种范式：Naive RAG，Advanced RAG 和 Modular RAG。同时，它提供了 RAG 的三个主要组成部分：检索器、生成器和增强方法的摘要和组织，以及每个组件的关键技术。此外，论文讨论了如何评估 RAG 模型的有效性，并介绍了两种 RAG 的评估方法、重点指标和能力，以及最新的自动评估框架。最后，从垂直优化、水平可扩展性和 RAG 的技术堆栈和生态系统三个方面引入了潜在的未来研究方向。

Dec, 2023

在 Mistral 8x7B-v1 中引入 Super RAGs

通过将 Super RAGs 整合到 Mistral 8x7B v1（最先进的 LLM）中，本文研究了其在准确性、速度和用户满意度方面的改进，并通过使用微调的指令模型设置和缓存调优系统确保数据检索的效率和相关性，经过多个时期的评估表明，Super RAGs 能够有效增强 LLMs，为更复杂可靠的 AI 系统探索了新的途径。

Apr, 2024

RQ-RAG: 学习改进用于检索增强生成的查询

学习改进查询以实现检索增强生成，通过加入外部相关文档，使模型具备显式重写、分解和消歧的能力，并在各种问题回答数据集中取得了优于现有方法的表现。

Mar, 2024

大型语言模型中的检索增强生成的开发与测试 -- 一份案例研究报告

大型语言模型（LLMs）在医疗应用中具有重要潜力，而检索增强生成（RAG）被认为是一种有前景的方法来定制 LLMs 中的领域知识。该研究通过开发和评估一个专门针对医疗保健领域、特别关注术前医学的 LLM-RAG 流程，验证了其可行性。

Jan, 2024

大型语言模型的检索增强文本生成综述

Retrieval-Augmented Generation (RAG) 是一种合并检索方法和深度学习技术的方法，旨在通过动态整合最新的外部信息解决大型语言模型（LLMs）的静态限制，并通过使用真实世界的数据提供一种成本效益的解决方案来改进 LLMs 输出的准确性和可靠性。该研究将 RAG 范式分为四个类别，并从检索的角度提供了详细的视角，同时介绍了 RAG 的演进和领域的进展。此外，该论文还提出了针对 RAG 的评估方法，并提出了面临的挑战和未来的研究方向，旨在巩固现有的 RAG 研究，明确其技术基础，并突出其扩展 LLMs 的适应性和应用潜力。

Apr, 2024

面向电子离子对撞机的基于 RAG 的摘要生成代理

研究正在开发基于检索增强生成（RAG）的电子离子对撞机（EIC）AI 摘要代理（RAGS4EIC）。这一创新型的人工智能驱动框架不仅简化了庞大数据集的理解，还鼓励协作参与，从而增强了研究人员的能力。

Mar, 2024