May, 2024

幻影:检索增强语言生成的一般触发攻击

TL;DR检索增强生成(RAG)通过使用外部知识数据库,扩展现代大型语言模型(LLMs)在聊天机器人应用中的能力,使开发者能够在没有昂贵的训练或微调的情况下调整和个性化LLM的输出。本研究提出了针对RAG增强LLMs的新攻击方式,通过向其知识数据库中注入单个恶意文档来危害受害者的RAG系统,从而引发多种针对生成模型的恶意攻击。