避免偏见的对抗性分布：无需重新训练的修复方法

Jan, 2019

避免偏见的对抗性分布：无需重新训练的修复方法

Repairing without Retraining: Avoiding Disparate Impact with Counterfactual Distributions

Hao Wang, Berk Ustun, Flavio P. Calmon

TL;DR利用机器学习模型的输出和输入的概率分布对基于敏感属性（如性别或种族）的性能不均衡进行量化，并通过扰动劣势群体的输入变量的分布来减少固定分类模型对感兴趣人群的影响，从而通过数据预处理器实现消除性能差异的目的。

Abstract

When the performance of a machine learning model varies over groups defined by sensitive attributes (e.g., gender or ethnicity), the performance disparity can be expressed in terms of the probability distribution

machine learning performance disparity classification model fairness criteria counterfactual distribution

发现论文，激发创造

反事实公平性

本文提出了一个利用因果推断工具来建立公正性模型的框架，以避免机器学习在保险、贷款、雇佣和预测执法等领域的不公正决策，避免造成基于不公正数据的歧视性做法，以法学院成功的公平预测为实际问题进行了实证研究。

Mar, 2017

公平无知背景下的反事实推理用于偏差评估与检测

该研究论文探讨了即使在没有敏感特征的情况下，机器学习模型仍可能存在歧视偏见的问题，并提出了利用反事实推理揭示模型潜在偏见的方法。

Feb, 2023

透过反事实预测实现平等机会和肯定行动

本文提出了两个算法，通过因果模型和反事实决策来实现公平的机器学习预测器，以实现提供平等机会和重修历史劣势。在包括招生、收入、信用和再犯等领域的数据集上进行评估与权衡，结果表明这些预测器在理论上达到了预测性能的最优，同时满足公平性。

May, 2019

超越不公平对待和不公平影响：在不造成不公平待遇的情况下学习分类

介绍了一种新的不公平性概念 —— 不同的不公平待遇，并提出了针对基于决策边界分类器的不同不公平待遇的直观度量方法，这些方法可以轻松地作为凸 - 凹约束包含在公式中。实验表明，该方法在避免不同不公平待遇方面是有效的。

Oct, 2016

公平临床风险预测的反事实推理

本文使用机器学习系统支持决策制定在医疗保健中的问答涉及使用电子医疗记录中的观察性数据中隐含的偏见，进而进一步发展了组公平性标准，以在个体层面上扩展增益计数事实公正标准，探讨扩增的标准是否可以应用于使用观测性电子健康记录数据的病人长住和死亡的公平模型的开发。通过一个假设因果图的变分自动编码器来执行反事实推理，提供了一种在学习生成模型的背景下，在公平维护与预测性能下降之间权衡的方法。

Jul, 2019

反事实公平表达

在这项研究中，我们提出了一种使用所有可用特征进行训练的新算法，从理论和实证方面证明了使用该方法训练的模型能够满足 Counterfactual Fairness。

Nov, 2023

预测敏感性：部署的分类器中反事实公平性的持续审计

该研究提出了一种基于预测敏感性的方案，用于对已部署的分类器进行持续审计，以识别反对事实上的公正性。该方案不需要保护状态信息的预测时间，可以利用保护状态和其他特征之间的相关性，并展示了该方法有效检测反对事实上公正性的违规情况。

Feb, 2022

从观测数据中学习反事实公平性

本文提出了一种新的框架 CLAIRE，通过对反事实数据增广和不变化惩罚的表征学习框架有效地减轻了敏感属性的偏差，并在合成和真实数据集上的实验验证了 CLAIRE 在反事实公平性和预测性能方面的优越性。

Jul, 2023

迈向公平机器学习软件：通过反事实推理理解和解决模型偏见

本研究通过反事实思考，提出一种针对 ML 软件中偏见根源的创新对策，并将优化性能和公平性模型相结合，成功提高了 ML 软件的公平性并保持了高竞争力性能

Feb, 2023

使用反事实推论的因果视角评估和缓解图像分类器中的偏差

该研究提出了一种利用结构原因模型和 ALI 生成对抗学习算法，生成能满足图像属性之间因果关系约束的反事实例，用于解释和评估神经网络模型的偏差，并使用反事实正则化方法消除分类器训练数据中对皮肤和头发颜色等多维属性的偏见。

Sep, 2020