ACLMay, 2022

透过对抗事实数据消除性别歧视和仇恨言论检测中的偏差

TL;DR研究结论表明:使用 CAD 的模型在面对一些难以处理的数据集时,由于对核心元素进行扰动引入了模型偏见,甚至比原始数据训练的模型误报率更高。使用多样化的 CAD (既有构造驱动又有用于基础特征不变的 CAD) 可以减少此类意外偏差。