源代码模型的语义鲁棒性

Feb, 2020

Semantic Robustness of Models of Source Code

Goutham Ramakrishnan, Jordan Henkel, Zi Wang, Aws Albarghouthi, Somesh Jha...

TL;DR研究表明，在源代码模型中，深度神经网络容易受到对代码功能保留的参数语义程序转换序列引起的对抗性示例的影响，我们发现对抗性训练可以显著提高模型的鲁棒性。

Abstract

deep neural networks are vulnerable to adversarial examples - small input perturbations that result in incorrect predictions. We study this problem for models of →

deep neural networks adversarial examples source code adversarial training robustness

发现论文，激发创造

代码的对抗鲁棒性

本文探讨神经模型在代码领域中的敌对鲁棒性问题，通过实例化针对代码的对抗攻击，并结合现有和新技术提高模型鲁棒性，同时保持高准确性。

Feb, 2020

面向对抗攻击具有抵抗能力的深度学习模型

通过稳健优化方法探究神经网络对抗攻击的鲁棒性，设计出对抗攻击和训练模型的可靠方法，提出对于一阶对手的安全保证，并得到针对广泛对抗攻击的高鲁棒性网络模型。

Jun, 2017

代码模型对抗性样本

该研究证明神经编程模型易受到对抗性攻击，并介绍了一种新方法 Discrete Adversarial Manipulation of Programs，通过引入微小的扰动来制造对抗性样本，以迫使预训练模型做出不正确的预测，从而攻击训练模型。该方法在三种神经架构：code2vec，GGNN 和 GNN-FiLM 中均可行，对 Java 和 C# 两种语言均适用，并展示了防御模型的各种方法和他们的权衡取舍。

Oct, 2019

源代码神经模型中的后门

本文介绍了如何在源代码任务中注入后门 (backdoors)，并证明了如何使用鲁棒统计学算法来检测恶意数据。

Jun, 2020

准确性和鲁棒性是否相关？

通过利用深度卷积神经网络生成对抗性样本，然后比较不同的生成技术在产生图像质量和测试机器学习模型鲁棒性方面的差异，最后在跨模型对抗迁移上进行了大规模实验，研究结果表明对抗性样本在相似的网络拓扑间是可传递的，并且更好的机器学习模型更不容易受到对抗性样本的攻击。

Oct, 2016

建立稳健模型的简单结构

通过添加一个用于协作训练的对抗样本检测网络和设计一种新的数据采样策略，我们建议了一个简单的架构来构建具有一定鲁棒性的模型，该模型能够适应许多不同的对抗攻击，并针对 Cifar10 dataset 的实验表明这种设计对模型的鲁棒性具有积极影响。

Apr, 2022

机器翻译模型面对敌对攻击表现强劲

深度学习模型中的对抗攻击通过对输入进行微小扰动，从而导致输出发生重大变化。我们的研究重点是这种对抗攻击对序列到序列（seq2seq）模型的影响，特别是机器翻译模型。我们引入了基本的文本扰动启发式算法和更高级的策略，例如基于梯度的攻击，该攻击利用可微分逼近的非可微分翻译度量。通过我们的调查，我们提供了证据表明机器翻译模型对已知最佳对抗攻击显示出鲁棒性，因为输出中的扰动程度与输入中的扰动成正比。然而，在次优方法中，我们的攻击方法优于其他方法，提供了最佳的相对性能。另一个有力的候选方法是基于混合单个字符的攻击。

Sep, 2023

STRATA: 适用于代码模型的简单、无梯度攻击

通过建立令牌频率统计与学习令牌嵌入之间的关系，我们构建了一种简单有效的无梯度方法，用于对代码模型生成最先进的对抗性示例。

Sep, 2020

神经网络对抗重编程

该研究提出使用单个对抗性扰动来重新编程目标模板，以执行攻击者选择的任务，即使模型没有为此任务进行训练，成功演示了多个模型的此类攻击。

Jun, 2018

探索证明深度神经网络的对抗鲁棒性

本研究论文论述了如何使用深度神经网络验证自动驾驶汽车的对抗鲁棒性问题，即证明网络的正确性以及研究自动控制器难度与机器学习的关系。

Sep, 2017