Oct, 2023

LLM 集成应用中的提示注入攻击与防御

TL;DR大型语言模型在 LLM 集成应用中存在提示注入攻击的安全漏洞,现有研究有限且缺乏系统性,本文提出了一般性的框架来理解和设计这种攻击,同时也提出了对应的防御框架,并基于 10 个 LLM 和 7 个任务进行了系统评估。