当可解释性遇上对抗学习：使用 SHAP 签名检测对抗样本

Sep, 2019

当可解释性遇上对抗学习：使用 SHAP 签名检测对抗样本

When Explainability Meets Adversarial Learning: Detecting Adversarial Examples using SHAP Signatures

Gil Fidel, Ron Bitton, Asaf Shabtai

TL;DR本文介绍了一种新的检测方法，该方法使用计算深度神经网络分类器的内部层的 Shapley 加性解释（SHAP）值来区分正常和对抗输入。通过针对流行的 CIFAR-10 和 MNIST 数据集构建数据集，训练基于神经网络的检测器去区分正常和对抗性输入，并评估了该方法在对抗攻击生成的对抗性数据上的检测能力。结果表明，该检测器具有高的检测准确性和对使用不同攻击方法生成的对抗性输入的强大泛化能力。

Abstract

State-of-the-art deep neural networks (DNNs) are highly effective in solving many complex real-world problems. However, these models are vulnerable to adversarial perturbation attacks, and despite the plethora of

deep neural networks adversarial perturbation attacks shapley additive explanations adversarial examples detection method

发现论文，激发创造

无监督模型解释技术检测对抗样本

本文提出一种使用模型解释方法检测异常样例的无监督方法，并在 MNIST 数据集上展现了该方法高效检测最先进算法所产生的对手样本。

Jul, 2021

使用机器学习和 Shapley 加性解释（SHAP）方法对分布式拒绝服务（DDoS）攻击检测进行分类和解释

该研究提出了一个框架，利用机器学习和可解释的人工智能技术，分类和识别 DDoS 攻击的合法流量和恶意流量，在使用 SHAP 进行解释后的分类器模型中，该模型的性能表现高于 99％的准确性。

Jun, 2023

深度学习中的对抗性示例：攻击与防御

本文研究深度学习中的对抗样本问题，总结了生成对抗样本的方法，提出了对抗样本的应用分类，并探讨了对抗样本的攻击和防御策略以及面临的挑战和潜在解决方案。

Dec, 2017

对抗样本的有趣特性

论文研究了神经网络模型的不确定性对于对抗样本的产生具有决定性作用，与体系结构、数据集和训练协议无关，表现为对抗误差具有与对抗扰动大小呈幂律的普适性，通过减小预测熵来提高对抗鲁棒性，在 CIFAR10 上使用神经架构搜索找到更鲁棒的架构。

Nov, 2017

DLA: 密集层分析用于对抗样本检测

本文介绍了一种新的端到端框架来检测深度神经网络中可能存在的对抗样本，采用神经元覆盖率引导测试来分析 DNN 的密集层激活模式，以实现实时检测，能够覆盖各种类型的 DNN 架构，包括 LSTM，防御了最先进的攻击，同时提供确保无法轻易绕过的白盒自适应攻击。

Nov, 2019

面向神经网络的不可察觉且强韧对抗样本攻击

该研究提出了一种新的对抗样本攻击方法，考虑到人类感知系统并最大化制作的对抗样本的噪声容忍度，实验结果证明了该技术的有效性。

Jan, 2018

检测来自伪像的对抗性样本

本文介绍了一种利用深度学习神经网络中 Bayesian 不确定性估计和密度估计的方法，可以实现对于对抗样本的检测，具有很好的泛化性能，并在标准分类任务上取得了 85-93% 的 ROC-AUC 表现。

Mar, 2017

解释和利用对抗样本

机器学习模型因神经网络的线性特性容易受到对抗性扰动的影响，该现象不同于过拟合和非线性，但可以通过生成对抗性训练样本来减小 MNIST 数据集中 maxout 网络的误差。

Dec, 2014

关于（统计）检测对抗样本的研究

本文研究如何检测机器学习中的对抗性样本，提出使用统计检验和模型增强的方法来识别对抗性样本，并参照多个数据集和对抗样本制作方法进行实验，结果表明统计学特性对于检测对抗性样本至关重要。

Feb, 2017

基于检测的防御策略：从隐写分析角度防御对抗样本

本研究提出了一种检测对抗性样例的方法，通过估计对抗性攻击造成的修改概率来增强隐写分析特征，实验证明该方法可以准确检测对抗性样例，并且没有基于神经网络，而是基于高维人工特征和 FLD (Fisher Linear Discriminant) 系列，因此不能直接进行二次对抗性攻击。

Jun, 2018