ACLMay, 2023

受盾形表示:通过迭代梯度投影保护敏感属性

TL;DR本文通过引入一种新的方法 IGBP,提出了一种在自然语言处理模型中去除非线性编码概念的方案,实验结果表明,该方法可以有效缓解社会偏见,并对下游任务的准确性没有太大的影响。