LLM 技术应用中的人类不可感知检索污染攻击

Apr, 2024

LLM 技术应用中的人类不可感知检索污染攻击

Human-Imperceptible Retrieval Poisoning Attacks in LLM-Powered Applications

Quan Zhang, Binqi Zeng, Chijin Zhou, Gwihwan Go, Heyuan Shi...

TL;DRLLM 应用开发、检索增强生成、LLM 应用、检索污染以及风险评估是本文的关键词。作者揭示了一种称为检索污染的新威胁，攻击者可以通过欺骗 LLM 应用程序在检索生成过程中生成恶意回应，对应用程序进行破坏。通过分析 LLM 应用程序框架，攻击者可以制作与正常文档在视觉上几乎无法区分的文档，一旦这些文档被用作检索增强生成的参考来源，应用程序就会产生错误的响应。初步实验表明攻击者可以以 88.33% 的成功率误导 LLM，并在现实世界的应用中达到 66.67% 的成功率，展示了检索污染的潜在影响。

Abstract

Presently, with the assistance of advanced llm application development frameworks, more and more llm-powered applications can effortlessly augment the LLMs' knowledge with external content using the →

advanced llm application development retrieval augmented generation llm-powered applications retrieval poisoning risk assessment

发现论文，激发创造

PoisonedRAG：对大型语言模型的检索辅助生成进行的知识投毒攻击

通过注入有毒文本到知识库中，攻击者可以使大型语言模型生成攻击者选择的目标问题的攻击者选择的目标答案。我们提出了两种解决方案来解决这个优化问题，分别从黑盒和白盒背景的角度出发，攻击成功率达到了 90%。我们还评估了最近提出的防御方法，结果显示它们对我们的攻击不足以进行有效防御，凸显出对新的防御方法的需求。

Feb, 2024

BadRAG：大型语言模型检测检索增强生成中的漏洞

通过结合检索式方法和生成模型，提出了 TrojRAG 来识别检索部分（RAG 数据库）的漏洞和攻击，并间接攻击生成部分（LLMs），通过中毒定制内容来实现检索后门和语义操纵，这些攻击可以包括 RAG 的拒绝服务攻击和以触发器为条件的生成 LLMs 的语义操纵。

Jun, 2024

幻影：检索增强语言生成的一般触发攻击

检索增强生成（RAG）通过使用外部知识数据库，扩展现代大型语言模型（LLMs）在聊天机器人应用中的能力，使开发者能够在没有昂贵的训练或微调的情况下调整和个性化 LLM 的输出。本研究提出了针对 RAG 增强 LLMs 的新攻击方式，通过向其知识数据库中注入单个恶意文档来危害受害者的 RAG 系统，从而引发多种针对生成模型的恶意攻击。

May, 2024

LLMs 知道他们所需：利用缺失信息导向框架强化检索辅助生成

通过实验证明语言模型具有提取信息和判断缺失信息的能力，基于此发现，本文提出了一种 Missing Information Guided Retrieve-Extraction-Solving（MIGRES）范式，利用缺失信息的识别生成有针对性的查询来引导后续的知识检索，同时设计了一种基于句子级别的重新排序过滤方法，以过滤掉无关的内容，并结合语言模型的信息提取能力从干净的文档中提取有用信息，从而增强 Retrieval-Augmented Generation（RAG）的整体效力。大量实验证明了所提出的 MIGRES 方法的优越性，并分析实验证明了我们提出的模块的有效性。

Apr, 2024

工具呼叫：通过检索增强大型语言模型提升药物咨询

基于检索增强生成（RAG）的大规模语言模型（LLMs）在医学领域的知识密集型任务中表现出显著的性能提升，着重研究了利用 LLMs 和 RAG 框架回答基于医药数据库的查询问题，并提出了 Distill-Retrieve-Read 框架用于关键字搜索，实验结果证明了该框架在证据检索准确性方面的优势。

Apr, 2024

TrojanRAG: 大型语言模型中的检索增强生成可以成为后门驱动程序

利用 Retrieval-Augmented Generation 进行联合后门攻击，针对大型语言模型（LLMs）的安全威胁进行探讨，通过构建精巧的目标上下文和触发器集合，通过对比学习优化多对后门快捷方式，从而限制触发条件以提高匹配率，并引入知识图谱进行结构化数据构建实现目标上下文的精确匹配，验证后门对 LLMs 的真实伤害以及上下文是否为越狱模型提供有利工具，实验证明 TrojanRAG 在正常查询中保持检索能力同时展示多样化的安全威胁。

May, 2024

遵循我的指示并透露机密：检索增强型生成系统的可伸缩数据提取

Retrieval-Augmented Generation (RAG) 可以增强预训练模型，通过在测试时引入外部知识以实现定制化适应性。研究发现，Retrieval-In-Context RAG 语言模型中存在数据存储泄露的风险，对于多种现代语言模型以及 GPTs 模型，攻击利用模型的指令跟随功能，通过提示注入轻松从数据存储库中提取文本数据。通过设计一种攻击方法，可以在 25 个随机选择的自定义 GPTs 模型上以 100% 的成功率导致数据存储泄露，并且通过自身生成的仅 100 个查询，从包含 77,000 字的书籍和 1,569,000 字的文集中从文本数据中提取文本数据的比率为 41% 和 3%。

Feb, 2024

关于 RAG 遇见 LLM 的调研：走向检索增强的大型语言模型

检视了检索增强型大型语言模型（RA-LLMs）的现有研究，涵盖体系结构、训练策略和应用三个主要技术视角，并介绍了此类模型的基础知识和最新进展，以及它们为大型语言模型（LLMs）带来的实际意义和应用领域的挑战和能力，最后讨论了当前的局限性和未来研究的几个有前途的方向。

May, 2024

机器对抗 RAG：用阻塞文档干扰检索增强生成

使用检索增强生成（RAG）系统时，操作可能存在不受信任内容的数据库的 RAG 系统容易受到一种称为 “堵塞” 的新型拒绝服务攻击的影响。我们描述和分析了生成堵塞文档的几种方法，包括一种基于黑盒优化的新方法，不需要攻击者了解目标 RAG 系统使用的嵌入或 LLM，也不需要访问辅助 LLM 来生成堵塞文档。我们对几种 LLM 和嵌入的方法的有效性进行了测量，并证明了现有的 LLM 安全度量指标不能捕捉它们受到堵塞攻击的弱点，并讨论了对抗堵塞文档的防御方法。

Jun, 2024

T-RAG: LLM 战壕中的教训

构建一个基于 RAG 的 LLM 应用程序，Tree-RAG 使用树结构表示组织中的实体层级，并生成文字描述以增强响应用户查询的上下文。

Feb, 2024