基于降噪自编码器的防御蒸馏作为对抗鲁棒性算法

Mar, 2023

基于降噪自编码器的防御蒸馏作为对抗鲁棒性算法

Denoising Autoencoder-based Defensive Distillation as an Adversarial Robustness Algorithm

Bakary Badjie, José Cecílio, António Casimiro

TL;DR本文提出了一种结合了防御蒸馏机制和去噪自动编码器（DAE）的新方法，旨在通过识别和重构有毒的对抗性输入来降低蒸馏模型对毒性攻击的敏感性从而防御深度神经网络 (DNNs) 的对抗性攻击。实验结果表明，该方法成功地识别和重构了有毒的输入，同时也增强了 DNN 的韧性，为各种数据暴露风险问题所困扰的应用提供了强大和稳健的防御机制。

Abstract

adversarial attacks significantly threaten the robustness of deep neural networks (DNNs). Despite the multiple defensive methods employed, they are nevertheless vulnerable to poison attacks, where attackers meddle with the initial training data. In order to defend DNNs against such adv

adversarial attacks deep neural networks defensive distillation mechanism denoising autoencoder data poisoning attacks

发现论文，激发创造

基于蒸馏的深度神经网络对抗性扰动防御

本研究介绍了一种防御机制，名为防御蒸馏，用于减少对深度神经网络的对抗样本的影响，并通过理论和实验证明了该机制在培训深度神经网络时具有通用性和鲁棒性。

Nov, 2015

利用去噪自编码器进行对抗净化

该研究提出了一种名为 APuDAE 的深度学习框架，利用去噪自编码器（DAE）以自适应方式净化样本，并提高目标分类器网络的分类准确度并使其更加鲁棒。

Aug, 2022

评估神经网络的鲁棒性

本研究介绍了新型攻击算法，证明了防御蒸馏并不能显著提升神经网络的强度，提供了高置信度的对抗性样本用于简单的可迁移性测试，该测试可以用于破解防御蒸馏。

Aug, 2016

利用助教提高防御性蒸馏

该项目研究深度神经网络中的对抗攻击并探讨防御性蒸馏的方法，提出通过引入辅助网络来改善蒸馏模型的鲁棒性，并通过实验证明该方法的有效性及其对模型准确性的影响。

May, 2023

面向对抗样本具鲁棒性的深度神经网络架构

该研究论文研究了深度神经网络的鲁棒性问题，特别是针对对抗样本的攻击。通过探索神经网络的结构，拓扑结构，预处理和训练策略等方面来提高深度神经网络的抗干扰能力，并且通过引入平滑性惩罚来提高其稳健性。

Dec, 2014

防御蒸馏的扩展

本研究探讨机器学习在面对对抗性示例时的弱点以及通过重新审视防御蒸馏来应对其挑战，旨在提高模型训练技术的重要性。

May, 2017

使用卷积自动编码器防御对抗性攻击

基于卷积自编码器的方法提高目标分类器对抗性攻击的鲁棒性，通过生成与输入图像相似的图像来恢复模型的准确性。

Dec, 2023

扩散去噪作为清洗标签中毒的认证防御

我们提出了一种经过认证的防御方法来对抗无标签污染攻击，通过使用扩散模型对受损的训练数据进行处理，我们在七种无标签污染攻击中将攻击成功率降低到 0-16%，同时几乎不影响测试准确率。与现有的对抗无标签攻击的防御方法相比，我们的防御方法在降低攻击成功率和保持模型效用方面表现最好。我们的结果强调未来需要研究开发更强大的无标签攻击方法，并将我们的认证而实用的防御方法作为评估这些攻击方法的强有力的基准。

Mar, 2024

使用扩散模型的威胁模型不可知对抗性防御

本文介绍了一种在各种威胁模型下生成鲁棒分类器的方法，该方法利用了随机生成建模的最新进展，并利用条件分布采样。通过在被攻击的图像上添加高斯独立同分布噪声，然后进行预训练扩散过程，该方法表现出了可观的鲁棒性。该鲁棒性在 CIFAR-10 数据集上经过了广泛的实验验证，表明我们的方法在各种威胁模型下优于主要的防御方法。

Jul, 2022

基于表示学习的去噪填充自编码器实现可解释的反应堆系统诊断

本文提出了一种基于深度学习理论的诊断过程，该过程确保了对于嘈杂和损坏的数据的鲁棒性和可解释性，并采用新型的去噪填充自编码器（DPAE）进行了表示提取，以及浅层统计学习算法进行了后续的表示提取和异常诊断分类和回归，最后通过 SHAP 和特征消融等方法分层解释算法，为高安全要求的反应堆异常诊断系统的构建提供了可靠的参考方法。

Aug, 2022