BriefGPT.xyz
大模型
Ask
alpha
关键词
forge triggers
搜索结果 - 1
神经执行:针对提示注入攻击的学习(和对学习的利用)执行触发器
我们引入了一种新型的注入攻击家族,被称为神经执行。与依赖手工制作字符串(例如 “忽略之前的指令并...”)的已知攻击不同,我们展示了将执行触发器的创建概念化为可微分的搜索问题,并使用基于学习的方法自动生成它们的可能性。我们的结果表明,一个有
→
PDF
4 months ago
Prev
Next