BriefGPT.xyz
Ask
alpha
关键词
security issue
搜索结果 - 2
PromptAttack:一种基于提示的语言模型梯度搜索攻击方法
本文提出一个恶意提示模板构造方法(PromptAttack)来探究预训练语言模型(PLMs)的安全性能。对三个数据集和三个 PLMs 进行广泛实验,证明了我们提出的 PromptAttack 方法的有效性。我们还进行了实验,验证了我们的方法
→
PDF
2 years ago
CVPR
深度卷积网络对傅里叶基函数方向的结构敏感性研究
通过研究深卷积网络的灵敏度,我们发现傅里叶基函数方向上的微小改变可以导致网络准确率下降,这是一种有潜在安全风险的现象,然而这种有害扰动的共享方向特征仍然未知。鉴于对其性质的探究,我们针对黑盒模型提出了一个通用算法,可以生成具有位移不变性的通
→
PDF
6 years ago
Prev
Next