ACLApr, 2021

双重扰动:关于鲁棒性和反事实偏差评估的稳健性

TL;DR本文提出一种 “双重扰动” 框架,以揭示测试数据集之外的模型弱点。我们将该框架应用于研究两种基于扰动方法的分析模型稳健性和反事实偏差的方法,并引入新的攻击方法以找到易受攻击的案例。该方法可揭示在测试数据集中未直接显示的隐含模型偏见。