分析对抗样本：一个研究对手知识的框架

Feb, 2024

分析对抗样本：一个研究对手知识的框架

SoK: Analyzing Adversarial Examples: A Framework to Study Adversary Knowledge

Lucas Fenaux, Florian Kerschbaum

TL;DR对于机器学习模型而言，对抗性样本是指触发误分类的恶意输入。我们发现当进行攻击时，对抗者的知识缺乏研究和形式化，导致攻击研究领域在威胁模型和攻击方法上非常复杂且难以比较。本研究在图像分类领域提供了一个受序理论启发的理论框架来研究对抗者的知识，同时提出了一个受密码学游戏启发的对抗性样本游戏来标准化攻击。通过对最近的图像分类领域攻击进行整理和分类，我们从中总结出攻击者的知识，既验证了关于对抗者知识的现有观点，如受攻击模型信息的重要性，也得出了新的结论，例如白盒和可传递威胁模型的困难程度可能没有之前想象的那么高。

Abstract

adversarial examples are malicious inputs to machine learning models that trigger a misclassification. This type of attack has been studied for close to a decade, and we find that there is a lack of study and for

adversarial examples machine learning models attack research image classification adversary knowledge

发现论文，激发创造

现代机器学习中的对抗样本：一次回顾

本文对机器学习模型在视觉领域中面临的对抗性攻击和防御方法进行了广泛探讨，并讨论了不同攻击和防御方法的优点和缺点。旨在提供广泛的领域覆盖和机械进攻和防御机制的直观理解。

Nov, 2019

对抗样本 - 现象的完整特征描述

本研究提供了对毒瘤样本现象的完整刻画，目的在于涵盖研究领域的所有重要方面：（1）毒瘤样本存在的假设，（2）对安全性、可靠性和稳健性的影响，（3）生成和保护对抗样本的方法，（4）毒瘤样本在不同机器学习模型之间的转移能力。（5）本文提供充足的背景信息，可作为调查、教程或使用毒瘤样本进行攻击和防御的目录。

Oct, 2018

物理世界中的对抗样本

本文研究表明即使在物理世界的情境下，机器学习系统仍然容易受到敌对样本的攻击，并通过将手机摄像头获取的对抗性图像输入 ImageNet Inception 分类器，并测量系统的分类精度来证明了这一点。

Jul, 2016

对抗样本研究中的游戏规则动机

本文介绍如何通过建立人们更真实可靠的威胁模型，从而更好地保护机器学习在实际应用中的安全性。

Jul, 2018

分析对可解释机器学习的敌对样本的影响

本文分析对文本分类问题中的解释模型造成的对抗攻击的影响，包括开发一个基于机器学习的分类模型，引入对抗性扰动来理解分类性能，并在攻击之前和之后分析和解释模型的可解释性。

Jul, 2023

图像分类中的对抗机器学习：从防御者的视角进行调查

这篇论文探讨了深度学习在图像分类中的安全问题，介绍了针对对抗攻击和对抗防御的新分类方法，提供了研究者需要考虑的相关指导，并讨论了未来研究的方向。

Sep, 2020

SoK：智能网络入侵检测的逼真对抗攻击与防御

利用机器学习（ML）自动化异常检测和网络入侵检测（NID）中的网络攻击分类，提高检测性能。然而，虽然 ML 模型的好处很多，但它们容易受到经过特殊设计的对抗性网络攻击的影响。本文综述了目前最新的对抗学习方法，能够生成实际中可用于机器学习开发和部署的网络拓扑，并描述了 NID 领域中对对抗 ML 使用的挑战。

Aug, 2023

关于（统计）检测对抗样本的研究

本文研究如何检测机器学习中的对抗性样本，提出使用统计检验和模型增强的方法来识别对抗性样本，并参照多个数据集和对抗样本制作方法进行实验，结果表明统计学特性对于检测对抗性样本至关重要。

Feb, 2017

遥感中的对抗性样本

本文研究机器学习算法在遥感应用中的攻击，并在卫星图像分类问题的背景下对对抗样本进行了新的研究，同时考虑了现实世界的实际问题。

May, 2018

基于数据的黑盒分类器探索性攻击在对抗领域中的应用

本文提出了一种基于数据推动的黑客攻击方法 —— 基于分类模型的欺骗方法，并通过 Google Cloud Prediction 平台进行了实验验证，发现分类器天生易受攻击，并且可以轻松地进行逃避攻击，这为构建安全的机器学习框架提供了启示。

Mar, 2017