机器学习逃避攻击的解释引导诊断

MMJun, 2021

机器学习逃避攻击的解释引导诊断

Explanation-Guided Diagnosis of Machine Learning Evasion Attacks

Abderrahmen Amich, Birhanu Eshete

TL;DR本文介绍了一个新的框架，利用可解释的机器学习方法来指导高保真度评估机器学习逃避攻击，使用恶意软件和图像分类器进行综合评估，揭示了对抗样本与其上的对应扰动之间的关联差距，并展示了该方法对于评估机器学习模型鲁棒性的广泛使用。

Abstract

machine learning (ML) models are susceptible to evasion attacks. Evasion accuracy is typically assessed using aggregate evasion rate, and it is an open question whether aggregate evasion rate enables feature-leve

machine learning evasion attacks explainable ml methods correlation analysis adversarial perturbations

发现论文，激发创造

测试时针对机器学习的逃避攻击

本文研究了机器学习在安全敏感应用中的应用，提出了一种基于梯度的方法来评估分类算法在对抗攻击下的安全性，并针对 PDF 文件中的恶意软件检测任务进行了实验，同时提出了一些相应的反制措施。

Aug, 2017

对抗规避攻击的攻击树分析

该研究提出了一种使用攻击树分析逃避攻击风险的量化评估方法，通过引入深度学习和传统攻击节点来表示逃避攻击的各种特征，并提出了构建攻击树的系统性构建过程，最后通过实验验证了该方法的多功能性和有效性。

Dec, 2023

网络入侵检测系统对抗性躲避攻击与防御的可行性评估

该文章回顾了许多现有的针对机器学习模型的对抗攻击，突出了一些尚未解决的挑战，一些特定领域的约束可能会增加制作对抗样本的难度，也强调了如何将这些理论应用到实践的挑战。

Mar, 2023

熊猫还是不是熊猫？通过交互式可视化理解对抗攻击

通过与 AML 学习者和教师的设计研究，引入 AdvEx 作为一个多层次交互式可视化系统，全面呈现对新手 AML 学习者的不同图像分类器的逃避攻击的性质和影响，我们定量和定性评估了 AdvEx，并通过用户研究和专家访谈的两部分评估结果表明，AdvEx 不仅作为理解 AML 机制的可视化工具非常有效，而且提供了一种有吸引力和愉快的学习体验，从而显示其对 AML 学习者的整体益处。

Nov, 2023

利用保守特征提高机器学习分类器抵抗实现逃避攻击的鲁棒性

通过考虑简化的攻击特征空间模型来设计鲁棒的人工智能模型，可以在检测 PDF 格式恶意软件时提高效果。在研究中发现，仅依靠特征空间模型的效果有限，但增加保留特征可以显著提高性能。此外，当面临各种恶意软件的攻击时，特征空间模型具有更广泛的鲁棒性。

Aug, 2017

MEGEX：基于梯度的可解释人工智能无数据模型提取攻击

本文提出了 MEGEX，针对一种梯度可解释人工智能的数据自由模型提取攻击。攻击者使用解释结果来训练生成模型以减少查询次数，可以在不准备输入数据的情况下成功窃取训练好的模型。实验表明，在 SVHN 和 CIFAR-10 数据集上，给定 200 万和 2000 万个查询，我们提出的方法可以重构高准确度的模型，分别是受害模型准确度的 0.97 倍和 0.98 倍，这暗示着模型的可解释性和难以窃取之间存在折衷。

Jul, 2021

对抗性特征选择抵御逃避攻击

该研究探讨了特征选择在对抗性环境下的安全性问题，并提出了一种面向对抗攻击的特征选择模型，以提高分类器的安全性。实验结果表明，该模型在垃圾邮件和恶意软件检测等应用场景具有较好的效果。

May, 2020

分析对可解释机器学习的敌对样本的影响

本文分析对文本分类问题中的解释模型造成的对抗攻击的影响，包括开发一个基于机器学习的分类模型，引入对抗性扰动来理解分类性能，并在攻击之前和之后分析和解释模型的可解释性。

Jul, 2023

URET: 通用鲁棒性评估工具包（用于规避）

我们提出了一个新的框架，可以生成不同输入类型和任务领域的语义正确和功能性对抗性输入，并展示了生成对抗性示例的重要性以便部署缓解技术。

Aug, 2023

稳健性分析解释的评估和方法

本文提出一种基于鲁棒性分析的特征解释新的评估标准，通过针对我们提出的评估标准进行优化，获得了松散且必要的解释和可以将当前预测移动到目标类的特征集。我们通过多领域实验和用户研究验证了我们评估标准和解释的有用性。

May, 2020