ACLMay, 2023

对话生成的白盒多目标对抗攻击

TL;DR通过提出一种名为 DGSlow 的白盒多目标攻击方法,该方法通过梯度优化来平衡生成精度与长度,并通过适应性搜索机制来逐步制作仅有几个修改的对抗样本,并将其用于四个基准数据集的全面实验,成功率比传统的以准确性为基础的方法更高,同时还展示了强大的攻击转移性。