可解释深度学习系统的单类目标特定攻击

Jul, 2023

可解释深度学习系统的单类目标特定攻击

Single-Class Target-Specific Attack against Interpretable Deep Learning Systems

Eldor Abdukhamidov, Mohammed Abuhamad, George K. Thiruvathukal, Hyoungshick Kim, Tamer Abuhmed

TL;DR本文介绍了一种名为 SingleADV 的单分类目标特定对抗攻击算法，旨在生成通用扰动，使目标模型混淆特定目标类别的对象，并确保高度相关和准确的解释。我们通过实验验证了 SingleADV 的有效性，并对其进行了反制措施的讨论。

Abstract

In this paper, we present a novel Single-class target-specific Adversarial attack called SingleADV. The goal of SingleADV is to generate a universal perturbation that deceives the target model into confusing a specific category of objects with a target category while ensuring highly relevant and accurate interpretations. The →

adversarial attack targeted attacks deep learning system universal perturbation interpretation models

发现论文，激发创造

深度网络的简单黑盒对抗扰动

研究表明，即使没有内部知识，对深度卷积神经网络进行黑盒攻击并制造对抗性样本是可行的，这暴露了深度神经网络的弱点，为设计安全的网络提供了检验。

Dec, 2016

计算机视觉中对抗攻击综述

深度神经网络被广泛用于各种下游任务，尤其是自动驾驶等安全关键场景，但深度网络常常受到对抗样本的威胁。对抗攻击可以分为白盒攻击和黑盒攻击，前者攻击者知道模型的参数和梯度，后者攻击者只能获取模型的输入和输出。攻击者的目的可以分为有目标攻击和非有目标攻击，黑盒设置是我们实践中会遇到的情况。

Aug, 2023

通用、可转移和有针对性的对抗攻击

本文使用一种名为对抗性样本的设计，产生一个可以同时攻击深度神经网络的通用攻击，包括目标攻击，通用攻击以及可转移攻击。

Aug, 2019

使用 DeepFool 算法定制深度神经网络的针对性类别操控的对抗攻击

通过提出 “Targeted DeepFool” 算法，该研究通过在深度神经网络上训练特定的攻击样本来应对对抗攻击，以提高图像质量的完整性和准确性。

Oct, 2023

深度防御：用改进的对抗训练训练 DNNs 提高其鲁棒性

本文提出了一种名为 “deep defense” 的训练方法来解决深度神经网络易受到对抗样本攻击的问题，通过将对抗扰动的正则化器与分类目标相结合，得到的模型能够直接且准确地学习抵御潜在的攻击，实验证明该方法在不同数据集上对比对抗 / Parseval 正则化方法有更好的效果。

Feb, 2018

风格化对抗防御

利用目标样本的样式和内容信息以及其类边界信息创建对抗性扰动，将其应用于多任务目标并进行深度监督，提取多尺度特征知识以创建最大分离对手，随后提出最大间隔对抗训练方法，最小化源图像与其对手之间的距离，并最大化对手和目标图像之间的距离，证明与最先进的防御相比，我们提出的对抗训练方法表现出强大的鲁棒性，对自然出现的损坏和数据分布变化具有良好的泛化能力，并保留了模型在干净样本上的准确性。

Jul, 2020

少样本对抗性域自适应

采用对抗训练来学习嵌入的子空间，同时最大化两个域之间的混淆并在语义上对齐它们，解决了少量有标签目标数据样本的深度模型的有监督域自适应问题。

Nov, 2017

火线下的可解释深度学习

本文是对解释性深度学习系统安全性探索的首次系统研究，发现现有 IDLS 的脆弱性高，提出了一种新的类对抗攻击 ADV^2，并通过实证研究证明了其具有欺骗性和实名性的可行性。文章发现了预测 - 解释不一致性是导致该脆弱性的根源，并尝试针对此进行了一些对策。

Dec, 2018

图像分类中的网络解释欺骗

本文提出了一种对抗性噪声网络攻击方法，有效地误导了深度神经网络，同时也改变了网络决策的解释算法，并引入一种控制条件测试神经网络解释算法准确性的方法，以促进更健壮的神经网络解释工具发展。

Dec, 2018

对抗游乐场：展示对抗样例如何愚弄深度学习的可视化套件

该研究介绍了一个名为 Adversarial-Playground 的基于 Web 的可视化工具，用于教育和探索深度学习在安全应用程序中的漏洞，并演示共同对抗策略对卷积神经网络的有效性。

Aug, 2017