深度学习中的对抗性示例：攻击与防御

Dec, 2017

深度学习中的对抗性示例：攻击与防御

Adversarial Examples: Attacks and Defenses for Deep Learning

Xiaoyong Yuan, Pan He, Qile Zhu, Xiaolin Li

TL;DR本文研究深度学习中的对抗样本问题，总结了生成对抗样本的方法，提出了对抗样本的应用分类，并探讨了对抗样本的攻击和防御策略以及面临的挑战和潜在解决方案。

Abstract

With rapid progress and significant successes in a wide spectrum of applications, deep learning is being applied in many safety-critical environments. However, deep neural networks have been recently found vulner

deep learning adversarial examples neural networks attacks defenses

发现论文，激发创造

对抗攻击与防御：一项调查

文章讨论了不同类型的威胁模型下的敌对攻击，以及近期对抗这些攻击的有效方法和挑战，以提高深度学习算法的鲁棒性。

Sep, 2018

现代机器学习中的对抗样本：一次回顾

本文对机器学习模型在视觉领域中面临的对抗性攻击和防御方法进行了广泛探讨，并讨论了不同攻击和防御方法的优点和缺点。旨在提供广泛的领域覆盖和机械进攻和防御机制的直观理解。

Nov, 2019

深度学习在对抗环境中的局限性

本文介绍了一种基于对深度神经网络输入输出映射的精确理解的算法，用于制造可以轻易被误分类的针对深度神经网络的对抗样本，通过计算不同类型的样本之间的硬度度量对不同的类型的样本抗击抗性进行了评估，并提出了防御针对性攻击的初步方法。

Nov, 2015

深度学习医学图像分析系统的对抗性攻击研究

医学深度学习系统可以被巧妙地构造对抗性例子攻击破坏，难以在实际临床设置中应用，本文发现医学深度学习模型对于对抗攻击比对自然图像模型更脆弱，但医学对抗攻击可以通过简单的检测器容易检测出来，这些发现可作为更可解释和安全的医学深度学习系统设计的依据。

Jul, 2019

自然语言处理中深度学习模型的对抗攻击调查

该研究综述了最近针对文本深度神经网络攻击的研究。通过研究，讨论了现有攻击对文本数据不可直接应用的问题，并提出了关于这个话题的建议。

Jan, 2019

物理世界中的对抗样本

本文研究表明即使在物理世界的情境下，机器学习系统仍然容易受到敌对样本的攻击，并通过将手机摄像头获取的对抗性图像输入 ImageNet Inception 分类器，并测量系统的分类精度来证明了这一点。

Jul, 2016

计算机视觉中深度学习对抗攻击威胁综述

本文综述了计算机视觉领域深度学习中的对抗攻击及其防御方法，包括攻击的设计、存在性和实际应用的评估，旨在提供更全面的研究方向展望及其实际意义。

Jan, 2018

通过可视化动态风险评估理解深度学习对抗性示例的防御

近年来，深度神经网络模型在各个领域取得了许多进展，但是它们也开始在风险关键任务中使用。模型的误诊可能导致严重事故甚至死亡。这引起了研究人员对这些模型的攻击进行研究，发现了一长串的漏洞，所以每个模型都应该进行防护。对抗性示例攻击是研究人员中广为人知的一种攻击，他们已经开发了一些防御措施来避免这种威胁。然而，这些防御措施与深度神经网络模型一样晦涩难懂，其工作原理仍然未知。因此，通过可视化它们如何改变目标模型的行为对于更精确地理解防御模型的性能修改是有趣的。在这项工作中，选择了一些对抗性示例攻击的防御措施，并以可视化的方式显示了每个防御措施在防御模型中的行为变化。选择了对抗训练、降维和预测相似度作为防御措施，使用了由卷积神经网络层和全连接神经网络层组成的模型。在每个防御方案中，将原始模型的行为与防御模型的行为进行对比，并通过可视化图表来表示目标模型。

Feb, 2024

面向神经网络的不可察觉且强韧对抗样本攻击

该研究提出了一种新的对抗样本攻击方法，考虑到人类感知系统并最大化制作的对抗样本的噪声容忍度，实验结果证明了该技术的有效性。

Jan, 2018

计算机视觉中对抗攻击综述

深度神经网络被广泛用于各种下游任务，尤其是自动驾驶等安全关键场景，但深度网络常常受到对抗样本的威胁。对抗攻击可以分为白盒攻击和黑盒攻击，前者攻击者知道模型的参数和梯度，后者攻击者只能获取模型的输入和输出。攻击者的目的可以分为有目标攻击和非有目标攻击，黑盒设置是我们实践中会遇到的情况。

Aug, 2023