学习可解释的公平表示

Jun, 2024

Learning Interpretable Fair Representations

Tianhao Wang, Zana Buçinca, Zilin Ma

TL;DR利用在表示学习过程中引入可解释的 “先验知识”，我们提出了一个学习可解释公平表达的通用框架，并在 ColorMNIST 和 Dsprite 数据集上进行实验证明，在下游分类任务中，与最先进的公平表达相比，我们的表达不仅可解释，而且准确性稍高且结果更公平。

Abstract

Numerous approaches have been recently proposed for learning fair representations that mitigate unfair outcomes in prediction tasks. A key motivation for these methods is that the representations can be used by third parties with unknown objectives. However, because current

fair representations interpretable prior knowledge prediction tasks downstream classification task

发现论文，激发创造

学习可控的公平表征

本文提出了一种信息理论动机的目标函数，用于学习在公平约束条件下最具表达力的数据表示，旨在通过控制不公平性极限的方式帮助用户控制数据表示的公平性，证明了现有方法无法完全实现此目标，通过引入一种优化模型参数和表达力 - 公平性权衡的方法来平衡多种公平概念的权衡，并在更低的计算成本下实现更高的表达能力。

Dec, 2018

学习对抗公平且可迁移的表示

本文旨在探讨用表示学习降低预测结果中的不公平因素。针对第三方使用这些学习到的表示却又不明确目标的情境，我们提出了对抗性表示学习方法来确保使用方的公平性。我们将群体公平（人口平等、平等赔率和平等机会）与不同的对抗目标联系起来，通过最坏情况的理论保证和实验验证，我们证明了对该目标的选择对于公平预测是至关重要的。此外，我们还展示了公平迁移学习的首个深入实验演示，并经验证明了我们学习到的表示在保持实用性的同时对新任务具有公平预测的能力，这是公平表示学习的重要目标。

Feb, 2018

学习平滑和公平的表示

为了防止受保护人口受到歧视，减轻数据拥有者法律责任，本文尝试通过映射特征到公平表征空间，预防性地消除特征与敏感属性之间的相关性。实验结果表明，平滑表征分布可提供公平证书的泛化保证，同时不降低下游任务的准确性。

Jun, 2020

在数据领域探索公平性表示

本文提出了一种数据之间的翻译方法，实现了图像或表格数据的公平性，有效避免保护特征的语义性对公平性造成的影响，并在实际数据集面对性别这一保护特征时表现出了很好的机会平等性。

Oct, 2018

可证明公正的表述

本文介绍了一种基于代表函数的方法，证明了其可实现机器学习中的公平，适用于聚合模型，具有透明度和防止恶性激励的优势，并应用于金融和刑事司法数据集。

Oct, 2017

学习最优公平分类树：可解释性、公平性和准确性之间的权衡

本研究设计了一个 MIO（mixed integer optimization）框架，用于学习最优的分类树算法，以及与任意公平性约束进行扩展；提出了一个新的模型可解释性度量标准，称为决策复杂度；在流行数据集上，我们对公平性、可解释性及预测准确性之间的权衡进行了综合分析，证明了我们的方法在几乎完全平等的情况下仍能保持精度.

Jan, 2022

学习确证个体公平表示

该论文提出了一种基于潜在表示的证书方法，帮助数据消费者获得现有和新数据点的个体公平性证书，实现了公平性约束和效用之间的平衡，并通过实验评估了该方法在五个真实数据集和多个公平性约束方面的可扩展性和表现力。

Feb, 2020

通过对抗性框架学习公平表示

本文介绍了一个最小二乘对抗框架，其中一个发生器生成学习个体的潜在表示，一个评论家保证了不同保护组的分布相似，从而在保留足够信息的同时解决了受保护属性引起的潜在偏差问题，为公平分类提供了理论保证。经验结果表明，这种方法可以有效地用于分类任务，特别是在删除受保护属性不足以实现公平分类的情况下。

Apr, 2019

关于解耦表示的公平性

本篇论文探讨了如何利用不同的解缠绕概念提高表示学习中多元回归模型的公平性，并证明在某些情况下，最优的和经验的预测结果都可能是不公平的。

May, 2019

挖掘可解释证据揭示不公平的模型

本文通过挖掘可解释证据，系统地解决了揭示不公平模型的新任务，找到高度可解释和实体证据以有效地揭示训练模型的不公平性。

Jul, 2022