Apr, 2024

低级扰动模拟野外文档对 RAG 管道的遗传攻击

TL;DR通过寻求大规模语言模型与检索生成的完美结合来解决其局限性,本论文研究了在评估检索生成鲁棒性时常被忽视的两个方面:对噪声文档的脆弱性和对检索生成系统的整体评估。同时,论文引入一种新的攻击方法——遗传攻击,用于揭示组成部分中的漏洞并测试系统对噪声文档的功能性。实验结果表明,遗传攻击在不同的数据库和语言模型上均能取得较高的攻击成功率,同时显著破坏了每个组成部分以及它们之间的协同作用,凸显了微小的文本不准确性对破坏现实世界中的检索生成系统所带来的巨大风险。