评估透过迁移学习所学习的神经网络的鲁棒性

ICLROct, 2021

评估透过迁移学习所学习的神经网络的鲁棒性

Towards Evaluating the Robustness of Neural Networks Learned by Transduction

Jiefeng Chen, Xi Wu, Yang Guo, Yingyu Liang, Somesh Jha

TL;DR本文从威胁分析视角出发，对基于转导学习的防御机制进行了系统评估，并提出了攻击模型空间的原则，通过这一原则设计的攻击框架 Greedy Model Space Attack 可以作为评估转导学习防御机制的新基准。同时，本文发现在考虑的攻击方式下，重新训练模型可以显著提高对抗攻击的鲁棒性。

Abstract

There has been emerging interest in using transductive learning for adversarial robustness (Goldwasser et al., NeurIPS 2020; Wu et al., ICML 2020; Wang et al., ArXiv 2021). Compared to traditional defenses, these

transductive learning adversarial robustness defense mechanisms bilevel optimization problem greedy model space attack

发现论文，激发创造

双管齐下：通过结合转导和拒绝机制实现更好的对抗鲁棒性

在拒绝和转导两个技术中，拒绝 + 转导可提供显著改进，本研究发展了一种新的转导方法，结合 Tram'er 的分类器 - 探测器技术，达到更好的鲁棒性。

May, 2023

图传导防御：一种用于图成员推断攻击的两阶段防御

本文解决了图转导学习中成员推理攻击的问题，提出了一种有效的两阶段防御方法 Graph Transductive Defense（GTD），该方法通过训练 - 测试交替训练计划和压缩策略的组合成功减少了训练和测试损失分布之间的差异，实验证明其性能优于 LBP（攻击 AUROC 平均下降 9.42%，实用性能平均提高 18.08%），可无缝集成到各种分类模型中，且开销较小。

Jun, 2024

基于 Transformer 的对抗攻击在安全领域中的有效性

评估了变压器对系统防御者的恶意样本的强健性以及对系统攻击者的对抗性样本的可迁移性，发现变压器所生成的对抗样本具有最高的可迁移率，对其他模型具有更强的对抗性，强调了研究在安全领域中使用变压器架构进行攻击和防御的重要性，并建议将其作为转移攻击设置中的主要架构。

Oct, 2023

通过平移不变攻击规避转移对抗样本的防御

本文提出了一种翻译不变攻击方法，该方法利用一个翻译图像集合上的扰动以生成更易于转移的对抗示例，并表明该方法通常适用于任何梯度攻击方法。作者在 ImageNet 数据集上广泛实验验证了该方法的有效性，并证明该攻击技术的存在不安全性。

Apr, 2019

学习动态转化以提高对抗迁移性能

通过学习选择最佳的变换组合以提高对抗传递能力的一种新方法，名为 Learning to Transform (L2T)，在实验中展现出优于现有方法的性能，并证实其有效性和实用意义。

May, 2024

通用对抗训练提高鲁棒性和泛化性

本文介绍一种名为生成对抗训练的方法，用于提高深度神经网络对测试集和域外样本的泛化能力，并增强其抵抗未知对抗攻击的能力。

Sep, 2021

消除对抗攻击在计算机网络间的传递能力整理

我们提出了一种新颖和全面的方法，以提高对卷积神经网络（CNNs）中对抗性示例的攻击强度和传递性的评估，以及验证计算机网络应用中是否存在传递性问题。我们的研究结果表明，即使在计算机网络应用中，对抗性示例对安全的威胁需要开发新的防御机制来增强深度学习技术的安全性。

Oct, 2023

基于对抗学习的图像翻译的理论分析

本文从几何学角度重新制定图像到图像翻译模型，提出了控制其泛化能力的条件，并对模型设计和数据集构建提出了指导性建议.

Jun, 2018

转移攻击再探：在实际计算机视觉环境下的大规模经验研究

本文通过大规模系统的实证研究，探究了云端机器学习服务平台的漏洞和其普遍存在的在深度神经网络中的 “对抗攻击” 问题，发现先前的假设和结论在真实世界环境下不再一致，并指出了对未来研究方向的启示。

Apr, 2022

攻防学习：网络安全游戏中的学习迁移

针对人类决策中的认知偏差设计网络防御系统已经取得了显著的成功，但该领域的研究主要集中在相对简单的攻击者认知偏差上，关于对抗行为或通过破坏攻击者行为来提高防御效果的研究较少。本文提出了一种受 Instance-Based Learning Theory，Theory of Mind 和 Transfer of Learning 认知能力启发的新型人类决策模型，通过在安全场景中从防御者和攻击者角色中学习，并对对手的信念，意图和行动做出预测，以更好地抵御各种攻击，这个模型明确建模了人类学习的转移，对网络安全具有实际应用的潜在价值。

Jun, 2023