Sep, 2019

通过区间传播实现对符号替换的可验证鲁棒性

TL;DR本文提出了一种解决NLP系统鲁棒性问题的方法,通过形式化验证系统对先前已定义的对抗攻击的稳健性,使用 基于区间边界传播法的模型验证方法模拟离散文本扰动,改进对数似然训练目标训练模型,该方法能够有效地验证模型,并保证模型在最坏情况下的鲁棒性。