targeted adversarial attack | BriefGPT

关键词targeted adversarial attack

搜索结果 - 4

通过有针对性的攻击揭示稳定扩散中的漏洞
本研究针对 Stable Diffusion 模型的脆弱性，提出一种生成特定图像的对抗性提示框架，并通过揭示导致模型脆弱性的机制来证明方法的有效性。
PDF6 months ago
黑盒定向对抗攻击 Segment Anything (SAM)
该研究旨在对 SAM 进行有针对性的对抗攻击，提出了一种仅攻击图像编码器的简单且有效的方法，并提出了一种新的正则化损失以增强不同模型之间的特征传递性，通过增加对随机自然图像的特征占优势来进行黑盒对抗攻击。
PDF9 months ago
ICLR稳健性分析解释的评估和方法
本文提出一种基于鲁棒性分析的特征解释新的评估标准，通过针对我们提出的评估标准进行优化，获得了松散且必要的解释和可以将当前预测移动到目标类的特征集。我们通过多领域实验和用户研究验证了我们评估标准和解释的有用性。
PDF4 years ago
通过特征层次扰动来提高黑盒攻击的标准和严格可转移性
该研究讨论在深度神经网络（DNN）图像分类器范围内的黑盒传递目标对抗攻击威胁模型，提出的方法通过扰动特征层级上的表示来模仿其他类别，使用灵活的攻击框架显示出 ImageNet DNNs 之间的最新目标传输性能，并说明其优越性，相比于其他黑盒
PDF4 years ago