ACLMay, 2023
受盾形表示:通过迭代梯度投影保护敏感属性
Shielded Representations: Protecting Sensitive Attributes Through Iterative Gradient-Based Projection
Shadi Iskander, Kira Radinsky, Yonatan Belinkov
TL;DR本文通过引入一种新的方法 IGBP,提出了一种在自然语言处理模型中去除非线性编码概念的方案,实验结果表明,该方法可以有效缓解社会偏见,并对下游任务的准确性没有太大的影响。