Apr, 2024

LLM 技术应用中的人类不可感知检索污染攻击

TL;DRLLM 应用开发、检索增强生成、LLM 应用、检索污染以及风险评估是本文的关键词。作者揭示了一种称为检索污染的新威胁,攻击者可以通过欺骗 LLM 应用程序在检索生成过程中生成恶意回应,对应用程序进行破坏。通过分析 LLM 应用程序框架,攻击者可以制作与正常文档在视觉上几乎无法区分的文档,一旦这些文档被用作检索增强生成的参考来源,应用程序就会产生错误的响应。初步实验表明攻击者可以以 88.33% 的成功率误导 LLM,并在现实世界的应用中达到 66.67% 的成功率,展示了检索污染的潜在影响。