通过对抗性框架学习公平表示

Apr, 2019

Learning Fair Representations via an Adversarial Framework

Rui Feng, Yang Yang, Yuehan Lyu, Chenhao Tan, Yizhou Sun...

TL;DR本文介绍了一个最小二乘对抗框架，其中一个发生器生成学习个体的潜在表示，一个评论家保证了不同保护组的分布相似，从而在保留足够信息的同时解决了受保护属性引起的潜在偏差问题，为公平分类提供了理论保证。经验结果表明，这种方法可以有效地用于分类任务，特别是在删除受保护属性不足以实现公平分类的情况下。

Abstract

fairness has become a central issue for our research community as classification algorithms are adopted in societally critical domains such as recidivism prediction and loan approval. In this work, we consider the potential →

fairness bias protected attributes latent representations fair classification

发现论文，激发创造

当对抗性学习公平表征时的数据决策与理论含义

本文研究通过对抗训练神经网络来消除敏感属性信息从而实现分类器 “公平” 的方法。发现只需要少量数据即可训练出具有公平性的分类器，并且数据分布影响对手的公平概念。

Jul, 2017

通过潜空间去偏置实现公平的属性分类

本文介绍了一种使用 GAN 生成图像并在潜在空间中扰动以生成可以平衡每个受保护属性的训练数据的方法，以缓解由相关性所引起的偏差，通过在原始数据集上增加扰动生成的数据，实证证明训练结果准确且具有许多定量和定性上的优势。在 CelebA 数据集上进行了全面评估和分析，与现有文献进行了比较。

Dec, 2020

通过对抗特征学习实现可控的不变性

本文提出了一种通过对抗学习策略学习能够抵抗特定数据因素影响的新型表示学习方法，并通过多个基准测试表明所提出的方法可以获取到不变表示，从而提高模型的泛化能力。

May, 2017

学习对抗公平且可迁移的表示

本文旨在探讨用表示学习降低预测结果中的不公平因素。针对第三方使用这些学习到的表示却又不明确目标的情境，我们提出了对抗性表示学习方法来确保使用方的公平性。我们将群体公平（人口平等、平等赔率和平等机会）与不同的对抗目标联系起来，通过最坏情况的理论保证和实验验证，我们证明了对该目标的选择对于公平预测是至关重要的。此外，我们还展示了公平迁移学习的首个深入实验演示，并经验证明了我们学习到的表示在保持实用性的同时对新任务具有公平预测的能力，这是公平表示学习的重要目标。

Feb, 2018

学习可控的公平表征

本文提出了一种信息理论动机的目标函数，用于学习在公平约束条件下最具表达力的数据表示，旨在通过控制不公平性极限的方式帮助用户控制数据表示的公平性，证明了现有方法无法完全实现此目标，通过引入一种优化模型参数和表达力 - 公平性权衡的方法来平衡多种公平概念的权衡，并在更低的计算成本下实现更高的表达能力。

Dec, 2018

在数据领域探索公平性表示

本文提出了一种数据之间的翻译方法，实现了图像或表格数据的公平性，有效避免保护特征的语义性对公平性造成的影响，并在实际数据集面对性别这一保护特征时表现出了很好的机会平等性。

Oct, 2018

通过对抗网络逼近机器学习公平性

介绍一种新的针对敏感特征的机器学习公平性框架，通过去除敏感信息和最小化敏感特征的边际贡献来改善模型的公平性。实验结果表明，该模型在公平性指标和预测性能方面均优于相关最先进方法。

Sep, 2019

伦理对手：通过对抗机器学习缓解不公平现象

提出了一个框架以减少训练数据集中不公平的代表性，其中使用两个相互操作的对手功能来提高公平性。首先，通过训练模型防止猜测受保护属性的值，同时限制效用损失，实现模型公平性优化。然后，利用对抗机器学习的规避攻击生成新的被错误分类的例子，并用于第一步模型的重新训练和改进增强模型的公平性。将这两个步骤迭代应用，直到显著提高公平性。

May, 2020

对抗式叠加自编码器用于公平表示学习

本研究提出了一种基于不同层级的数据表征的公平表征学习方法，通过堆叠不同的自编码器在不同的潜在空间强制执行公平性，更好地满足公平度量标准并提高数据表征的公平性。

Jul, 2021

公正感知学习与无偏表示

本研究提出一种新算法，可以识别和处理潜在的歧视因素，确保机器学习模型的公平性，从而提高模型性能，实现非歧视分类和回归任务。

Feb, 2020