ACLJan, 2021

Polyjuice:生成对抗样本用于模型解释、评估和优化

TL;DR本研究介绍了 Polyjuice,一种基于 GPT-2 的通用对抗生成器,可以控制扰动类型和位置,并且可以用于多种应用,包括提高模型训练和评估、增强状态 - of-the-art 的解释技术以及支持系统性对抗性错误分析。