Nov, 2024
基于链关联的自然语言处理系统攻击与防御
Chain Association-based Attacking and Shielding Natural Language
Processing Systems
TL;DR本研究针对自然语言处理系统的脆弱性,提出了一种基于链关联的对抗攻击方法,利用了人类与机器之间的理解差距。通过生成汉字的链关联图并应用粒子群优化算法,我们发现高级自然语言处理模型对这种攻击敏感,而人类则能够良好理解受到干扰的文本。同时,我们探讨了对抗训练和基于关联图的恢复两种防护方法,以提高系统的安全性。