通过可视化动态风险评估理解深度学习对抗性示例的防御

Feb, 2024

通过可视化动态风险评估理解深度学习对抗性示例的防御

Understanding Deep Learning defenses Against Adversarial Examples Through Visualizations for Dynamic Risk Assessment

Xabier Echeberria-Barrio, Amaia Gil-Lerchundi, Jon Egana-Zubia, Raul Orduna-Urrutia

TL;DR近年来，深度神经网络模型在各个领域取得了许多进展，但是它们也开始在风险关键任务中使用。模型的误诊可能导致严重事故甚至死亡。这引起了研究人员对这些模型的攻击进行研究，发现了一长串的漏洞，所以每个模型都应该进行防护。对抗性示例攻击是研究人员中广为人知的一种攻击，他们已经开发了一些防御措施来避免这种威胁。然而，这些防御措施与深度神经网络模型一样晦涩难懂，其工作原理仍然未知。因此，通过可视化它们如何改变目标模型的行为对于更精确地理解防御模型的性能修改是有趣的。在这项工作中，选择了一些对抗性示例攻击的防御措施，并以可视化的方式显示了每个防御措施在防御模型中的行为变化。选择了对抗训练、降维和预测相似度作为防御措施，使用了由卷积神经网络层和全连接神经网络层组成的模型。在每个防御方案中，将原始模型的行为与防御模型的行为进行对比，并通过可视化图表来表示目标模型。

Abstract

In recent years, deep neural network models have been developed in different fields, where they have brought many advances. However, they have also started to be used in tasks where risk is critical. A misdiagnosis

deep neural network models misdiagnosis adversarial example attack defenses visualization

发现论文，激发创造

深度学习中的对抗性示例：攻击与防御

本文研究深度学习中的对抗样本问题，总结了生成对抗样本的方法，提出了对抗样本的应用分类，并探讨了对抗样本的攻击和防御策略以及面临的挑战和潜在解决方案。

Dec, 2017

深度学习医学图像分析系统的对抗性攻击研究

医学深度学习系统可以被巧妙地构造对抗性例子攻击破坏，难以在实际临床设置中应用，本文发现医学深度学习模型对于对抗攻击比对自然图像模型更脆弱，但医学对抗攻击可以通过简单的检测器容易检测出来，这些发现可作为更可解释和安全的医学深度学习系统设计的依据。

Jul, 2019

现代机器学习中的对抗样本：一次回顾

本文对机器学习模型在视觉领域中面临的对抗性攻击和防御方法进行了广泛探讨，并讨论了不同攻击和防御方法的优点和缺点。旨在提供广泛的领域覆盖和机械进攻和防御机制的直观理解。

Nov, 2019

对抗游乐场：展示对抗样例如何愚弄深度学习的可视化套件

该研究介绍了一个名为 Adversarial-Playground 的基于 Web 的可视化工具，用于教育和探索深度学习在安全应用程序中的漏洞，并演示共同对抗策略对卷积神经网络的有效性。

Aug, 2017

深度学习如何看世界：对抗攻击和防御调查

本文总结了最新的对抗攻击技术，利用现代防御策略对其进行分类，并概述视觉转换进展、反对抗设置中使用的数据集及度量标准，并在不同攻击下比较最新成果，最终确定了该领域的开放问题。

May, 2023

对抗攻击与防御：一项调查

文章讨论了不同类型的威胁模型下的敌对攻击，以及近期对抗这些攻击的有效方法和挑战，以提高深度学习算法的鲁棒性。

Sep, 2018

深度防御：用改进的对抗训练训练 DNNs 提高其鲁棒性

本文提出了一种名为 “deep defense” 的训练方法来解决深度神经网络易受到对抗样本攻击的问题，通过将对抗扰动的正则化器与分类目标相结合，得到的模型能够直接且准确地学习抵御潜在的攻击，实验证明该方法在不同数据集上对比对抗 / Parseval 正则化方法有更好的效果。

Feb, 2018

机器学习网络中的对抗攻击与防御：当代综述

本文综述了近期深度学习中对于对抗攻击和防御技术的研究进展，聚焦于基于深度神经网络的分类模型，并进行了对攻击和防御方法的分类和评价，其中重点介绍了正则化方法在提高模型的鲁棒性方面的应用。此外，还探索了新型攻击方式，如基于搜索、决策、降维和物理世界攻击，并提出了对于未来研究的建议。

Mar, 2023

高效的对抗攻击防御

本文提出了一种基于实践观察的新的防御方法，旨在强化深度神经网络的结构，提高其预测稳定性，从而更难受到针对性攻击，并在多种攻击实验中证明了该方法的有效性，相比其他防御方法具有更好的表现，而且在训练过程中的开销几乎可以忽略不计。

Jul, 2017

计算机视觉中深度学习对抗攻击威胁综述

本文综述了计算机视觉领域深度学习中的对抗攻击及其防御方法，包括攻击的设计、存在性和实际应用的评估，旨在提供更全面的研究方向展望及其实际意义。

Jan, 2018