Nov, 2024

通过后门实现的检索增强生成中的数据提取攻击

TL;DR本研究针对检索增强生成(RAG)系统的知识数据库中的数据提取攻击问题进行了深入探讨。我们提出了一种新的方法,通过在微调阶段注入少量毒化数据来创建后门,攻击者借此可以操控模型泄露数据库中的文件。研究结果显示,即使仅使用3%的毒化数据,我们的方法在精确提取方面也能达到79.7%的成功率,凸显了RAG系统在隐私保护方面的潜在风险。