Jun, 2024

机器对抗RAG:用阻塞文档干扰检索增强生成

TL;DR使用检索增强生成(RAG)系统时,操作可能存在不受信任内容的数据库的RAG系统容易受到一种称为“堵塞”的新型拒绝服务攻击的影响。我们描述和分析了生成堵塞文档的几种方法,包括一种基于黑盒优化的新方法,不需要攻击者了解目标RAG系统使用的嵌入或LLM,也不需要访问辅助LLM来生成堵塞文档。我们对几种LLM和嵌入的方法的有效性进行了测量,并证明了现有的LLM安全度量指标不能捕捉它们受到堵塞攻击的弱点,并讨论了对抗堵塞文档的防御方法。