Mar, 2022

针对基于 Transformer 的文本分类器的块状稀疏对抗攻击

TL;DR本文提出了一种基于梯度的对抗攻击方法,应用于基于 Transformer 的文本分类器中,实验结果表明,该攻击能够在保留句子语义的同时,对不同数据集上的 GPT-2 分类器准确率进行有效降低,通过对优化问题进行块稀疏约束,实现了对抗向量的小幅扰动。