Jun, 2024

显著关注和语义相似性驱动的对抗扰动

TL;DR本研究提出了一种增强型的文本对抗攻击方法,称为 Saliency Attention and Semantic Similarity driven adversarial Perturbation (SASSP)。该方法通过整合显著性、注意力和语义相似性,提高了上下文扰动的效果。实验证明,SASSP 不仅生成高度语义保真的对抗样本,而且有效地欺骗了最先进的自然语言处理模型。