分析对可解释机器学习的敌对样本的影响

Jul, 2023

分析对可解释机器学习的敌对样本的影响

Analyzing the Impact of Adversarial Examples on Explainable Machine Learning

Prathyusha Devabhakthini, Sasmita Parida, Raj Mani Shukla, Suvendu Chandan Nayak

TL;DR本文分析对文本分类问题中的解释模型造成的对抗攻击的影响，包括开发一个基于机器学习的分类模型，引入对抗性扰动来理解分类性能，并在攻击之前和之后分析和解释模型的可解释性。

Abstract

adversarial attacks are a type of attack on machine learning models where an attacker deliberately modifies the inputs to cause the model to make incorrect predictions. →

adversarial attacks machine learning models deep learning models text classification model interpretability

发现论文，激发创造

现代机器学习中的对抗样本：一次回顾

本文对机器学习模型在视觉领域中面临的对抗性攻击和防御方法进行了广泛探讨，并讨论了不同攻击和防御方法的优点和缺点。旨在提供广泛的领域覆盖和机械进攻和防御机制的直观理解。

Nov, 2019

物理世界中的对抗样本

本文研究表明即使在物理世界的情境下，机器学习系统仍然容易受到敌对样本的攻击，并通过将手机摄像头获取的对抗性图像输入 ImageNet Inception 分类器，并测量系统的分类精度来证明了这一点。

Jul, 2016

对敌对机器学习的阅读调查：敌对攻击及其理解

深度学习使我们能够高效地训练复杂数据的神经网络。然而，随着研究的增长，神经网络的几个弱点也被曝光。对抗机器学习是一种特定的研究领域，旨在利用和理解导致神经网络因输入接近原始输入而错误分类的一些弱点。提出了一类称为对抗性攻击的算法，用于在不同领域的各种任务上使神经网络错误分类。随着对对抗性攻击的广泛研究，了解对抗性攻击的分类是至关重要的。这将有助于我们以系统性的方式了解弱点，并帮助我们减轻对抗性攻击的影响。本文对现有的对抗性攻击及其不同角度的理解进行了概述，并简要介绍了现有对抗性防御措施及其在减轻对抗性攻击效果方面的局限性。此外，我们讨论了对抗机器学习领域未来研究的方向。

Aug, 2023

解释和利用对抗样本

机器学习模型因神经网络的线性特性容易受到对抗性扰动的影响，该现象不同于过拟合和非线性，但可以通过生成对抗性训练样本来减小 MNIST 数据集中 maxout 网络的误差。

Dec, 2014

深度学习中的对抗性示例：攻击与防御

本文研究深度学习中的对抗样本问题，总结了生成对抗样本的方法，提出了对抗样本的应用分类，并探讨了对抗样本的攻击和防御策略以及面临的挑战和潜在解决方案。

Dec, 2017

关于（统计）检测对抗样本的研究

本文研究如何检测机器学习中的对抗性样本，提出使用统计检验和模型增强的方法来识别对抗性样本，并参照多个数据集和对抗样本制作方法进行实验，结果表明统计学特性对于检测对抗性样本至关重要。

Feb, 2017

自然语言处理中深度学习模型的对抗攻击调查

该研究综述了最近针对文本深度神经网络攻击的研究。通过研究，讨论了现有攻击对文本数据不可直接应用的问题，并提出了关于这个话题的建议。

Jan, 2019

神经网络策略的对抗性攻击

本研究研究了针对神经网络策略的对抗攻击，发现现有的对抗样本制作技术能够很好地降低训练策略的测试时间性能，并且一些小干扰就能引起显著性能下降。

Feb, 2017

对抗样本 - 现象的完整特征描述

本研究提供了对毒瘤样本现象的完整刻画，目的在于涵盖研究领域的所有重要方面：（1）毒瘤样本存在的假设，（2）对安全性、可靠性和稳健性的影响，（3）生成和保护对抗样本的方法，（4）毒瘤样本在不同机器学习模型之间的转移能力。（5）本文提供充足的背景信息，可作为调查、教程或使用毒瘤样本进行攻击和防御的目录。

Oct, 2018

对抗学习攻击和防御的教程

本文主要介绍了机器学习算法在数字经济和人工智能等领域中的广泛应用，特别是在安全关键应用领域中的重要性。同时，文章详细介绍了对抗机器学习攻击的原理、攻击类型及当前各种防御机制的深度分析。

Feb, 2022