ACLJul, 2020

自然语言流畅的对抗样本生成

TL;DR本文提出了一种名为 MHA 的技术,采用 Metropolis-Hastings 采样,并结合梯度指导的方法构建攻击模型,实验证明该模型在攻击能力上优于基准模型,采用该模型进行对抗训练也能提高模型的稳健性和性能。