BriefGPT.xyz
Ask
alpha
关键词
non-targeted attacks
搜索结果 - 2
AAAI
自注意力归因:解释 Transformer 内部的信息交互
本文提出了一种自我注意力归因方法,通过对 BERT 等模型进行广泛的研究,发现这种方法能够用于识别重要的注意力头,构建注意力树,揭示变压器内的分层交互,以及可用作敌对模式实现非定向攻击。
PDF
4 years ago
ECCV
PatchAttack:一种基于纹理的黑盒攻击方法及其强化学习实现
PatchAttack 是一种基于纹理字典和增强学习的有效的图像对抗攻击方法,可以在图像中超级位置化小型纹理贴片从而成功诱导图像分类错误,即使在针对性攻击的情况下仅更改 3%至 10%的图像。
PDF
4 years ago
Prev
Next