ACLMar, 2019

关于对序列到序列模型进行对抗扰动评估

TL;DR提出一种新的 seq2seq 模型对抗攻击的评估框架,并证明现有方法普遍无法保持语义的等价性。同时,发现在对模型进行对抗性训练时,使用保持意义的攻击可以提高模型的鲁棒性而不影响测试性能。