Jan, 2022

针对预训练代码模型的自然攻击

TL;DR本文提出了一种针对代码模型的黑盒对抗攻击方法 ALERT,通过在保留原始输入的基础上考虑代码的自然语义,使得对抗样本更符合人类判断,并在三项下游任务中取得了高攻击成功率,最后对对抗性微调的效果进行了研究。