BriefGPT.xyz
Ask
alpha
关键词
malicious prompt template
搜索结果 - 1
PromptAttack:一种基于提示的语言模型梯度搜索攻击方法
本文提出一个恶意提示模板构造方法(PromptAttack)来探究预训练语言模型(PLMs)的安全性能。对三个数据集和三个 PLMs 进行广泛实验,证明了我们提出的 PromptAttack 方法的有效性。我们还进行了实验,验证了我们的方法
→
PDF
2 years ago
Prev
Next