EMNLPOct, 2022

平衡对抗训练:在 NLP 模型中平衡浮躁与顽固之间的权衡

TL;DR研究表明传统的对抗性训练方法在提高一个模型对于非真实标签的输入的识别能力时,可能会使其更加容易对真实标签的对抗性样本产生误判。因此,本文提出了一种基于对比学习的平衡对抗性训练方法,旨在提高模型对于既不改变真实标签,也不改变模型分类结果的对抗性样本的识别准确性。