Apr, 2020
TextAttack: 自然语言处理中对抗攻击、数据增广和对抗训练的框架
TextAttack: A Framework for Adversarial Attacks, Data Augmentation, and Adversarial Training in NLP
John X. Morris, Eli Lifland, Jin Yong Yoo, Jake Grigsby, Di Jin...
TL;DR本篇论文介绍了一种名为 TextAttack 的 Python 框架,用于在自然语言处理中进行敌对攻击、数据增强和对抗性训练,通过 TextAttack 的模块化设计,研究人员可以轻松构建来自新颖和现有组件的攻击。该框架实现了 16 种从文献中学来的敌对攻击,并支持各种模型和数据集,包括 BERT 和其他变压器,并提供使用对抗攻击的组件来提高模型的准确性和鲁棒性的数据增强和对抗训练模块。