HoneyModels：机器学习蜜罐

MMFeb, 2022

HoneyModels: Machine Learning Honeypots

Ahmed Abdou, Ryan Sheatsley, Yohan Beugin, Tyler Shipp, Patrick McDaniel

TL;DR研究纵观 Adversarial Machine Learning 防御策略的不足，通过建立 HoneyModels 模型，给模型添加特定知识水印来检测对抗性攻击，实验表明该模型可以检测到 69.5% 的攻击，并保留原模型的功能。

Abstract

machine learning is becoming a pivotal aspect of many systems today, offering newfound performance on classification and prediction tasks, but this rapid integration also comes with new unforeseen vulnerabilities. To harden these systems the ever-growing field of Adversarial

machine learning adversarial machine learning defense mechanisms honeymodels neural network

发现论文，激发创造

使用蜜罐捕获神经网络上的对抗攻击

我们在此论文中探讨一种新的防御机制来保护深度神经网络模型，该机制引入了陷阱门，通过激励攻击者搜索对抗性示例，它形成了防御系统，并证明了该防御系统能够避免最先进的攻击，并在分类方面几乎没有影响。

Apr, 2019

针对网络入侵检测系统的逼真对抗攻击建模

通过对网络入侵检测系统进行基于机器学习的威胁模拟，发现现有文献中的威胁模型不适用于实际的网络安全情景，因此，有必要加强现有防御系统以及探索更加真实和有效的对抗方式。

Jun, 2021

对抗学习攻击和防御的教程

本文主要介绍了机器学习算法在数字经济和人工智能等领域中的广泛应用，特别是在安全关键应用领域中的重要性。同时，文章详细介绍了对抗机器学习攻击的原理、攻击类型及当前各种防御机制的深度分析。

Feb, 2022

机器学习中安全与隐私科学的探索

ML 在安全性方面存在漏洞，提出威胁模型并对攻击进行分类，探究了模型准确性与抗敌对操作的关系。

Nov, 2016

制作有效的恶意软件对抗样本

应用强化学习算法生成对抗性恶意文件可以有效绕过大多数杀毒软件，揭示了基于机器学习的恶意软件检测系统易受对抗性攻击的脆弱性。

Jun, 2023

通过异常检测在污染攻击中检测对抗训练样例

本文提出一种防御机制来弥补机器学习中数据毒化的影响，该机制基于离群值检测来检测所谓的最优攻击策略生成的对抗样本与真实样本之间的差异。

Feb, 2018

强化防御：提升对抗训练与数字水印技术的模型韧性

该研究提出了一种新的框架，将对抗训练与水印技术相结合，以增强鲁棒性，抵御逃避攻击，并在知识产权盗窃情况下提供可信的模型验证。

Dec, 2023

陷阱设置：通过诱饵捕获和击败预训练语言模型中的后门

本研究旨在设计一种抵御后门攻击的微调过程，使用预训练语言模型并引入蜜罐模块，以吸收后门信息，并通过对中间层表示的约束，在微调过程中防止后门创建。在基准数据集上进行的综合实验证明了我们的防御策略的有效性和鲁棒性，与先前的最新方法相比，攻击成功率大幅降低了 10％至 40％。

Oct, 2023

关于（统计）检测对抗样本的研究

本文研究如何检测机器学习中的对抗性样本，提出使用统计检验和模型增强的方法来识别对抗性样本，并参照多个数据集和对抗样本制作方法进行实验，结果表明统计学特性对于检测对抗性样本至关重要。

Feb, 2017

工控系统中机器学习网络安全防御的对抗攻击

该研究探讨了如何使用对抗性学习通过生成基于 Jacobian 的显著性图攻击的对抗性样本以及探索分类行为，从而攻击监督模型。该分析还包括如何使用对抗性训练来支持监督模型的鲁棒性。随着对抗性样本的出现，两个广泛使用的分类器 —— 随机森林和 J48 的分类性能分别降低了 16 和 20 个百分点，但训练后它们的性能得到提高，证明了它们对这种攻击的鲁棒性。

Apr, 2020