BriefGPT.xyz
大模型
Ask
alpha
关键词
indirect prompt injection attacks
搜索结果 - 1
对大型语言模型间接提示注入攻击的基准测试与防御
通过使用第一个基准 BIPIA 来评估不同大型语言模型的鲁棒性和对间接提示注入攻击的防御方法,我们发现具有更高能力的大型语言模型在文本任务中更容易受到间接提示注入攻击,导致 ASR 更高。在此基础上,我们提出了基于提示学习的四种黑盒方法和基
→
PDF
6 months ago
Prev
Next