Jan, 2022

通过率失真最大化学习公平表示

TL;DR本文提出了一种新的去偏方法——公平感知率最大化(FaRM),该方法能通过使用率失真函数使属于同一个受保护属性类的实例的表示不相关,从而去除受保护的信息,其能够在有或没有目标任务的情况下去偏表示。经实验评估表明,FaRM在多个数据集上实现了最新的性能,并且学习到的表示对非线性探测网络的攻击泄漏了极少量的受保护属性信息。