伦理机器学习中的因果推断使用和误用

Feb, 2021

伦理机器学习中的因果推断使用和误用

The Use and Misuse of Counterfactuals in Ethical Machine Learning

Atoosa Kasirzadeh, Andrew Smart

TL;DR本文指出过度使用对社会类别（如种族或性别）进行因果推断所需的反事实可能导致一些困扰，并可能导致错误结论的结果，因此应该谨慎使用因果反事实，特别是在涉及高风险领域的算法公平和社交解释方面。

Abstract

The use of counterfactuals for considerations of algorithmic fairness and explainability is gaining prominence within the machine learning

counterfactuals algorithmic fairness social categories machine learning caution

发现论文，激发创造

反事实公平性

本文提出了一个利用因果推断工具来建立公正性模型的框架，以避免机器学习在保险、贷款、雇佣和预测执法等领域的不公正决策，避免造成基于不公正数据的歧视性做法，以法学院成功的公平预测为实际问题进行了实证研究。

Mar, 2017

迈向公平机器学习软件：通过反事实推理理解和解决模型偏见

本研究通过反事实思考，提出一种针对 ML 软件中偏见根源的创新对策，并将优化性能和公平性模型相结合，成功提高了 ML 软件的公平性并保持了高竞争力性能

Feb, 2023

机器学习的反事实解释和算法补救措施综述

本文综述分类了反事实解释的研究，包括如何评估和设计反事实解释算法，探讨了反事实解释在机器学习领域中的研究方向和发现的不足之处。

Oct, 2020

反事实解释可被操纵

本文介绍了反事实解释的脆弱性并表明其容易被操纵，进一步提出了一个新颖的目标来训练明显公平的模型，在轻微扰动下反事实解释可以找到更低成本的救济措施。然而，我们在贷款和暴力犯罪预测数据集上的实验表明，这些模型可能会不公平地提供低成本的救济措施给特定的子群体。这些发现引起了对当前反事实解释技术可信度的担忧，并希望能启发对健壮性反事实解释的探索。

Jun, 2021

公平临床风险预测的反事实推理

本文使用机器学习系统支持决策制定在医疗保健中的问答涉及使用电子医疗记录中的观察性数据中隐含的偏见，进而进一步发展了组公平性标准，以在个体层面上扩展增益计数事实公正标准，探讨扩增的标准是否可以应用于使用观测性电子健康记录数据的病人长住和死亡的公平模型的开发。通过一个假设因果图的变分自动编码器来执行反事实推理，提供了一种在学习生成模型的背景下，在公平维护与预测性能下降之间权衡的方法。

Jul, 2019

从观测数据中学习反事实公平性

本文提出了一种新的框架 CLAIRE，通过对反事实数据增广和不变化惩罚的表征学习框架有效地减轻了敏感属性的偏差，并在合成和真实数据集上的实验验证了 CLAIRE 在反事实公平性和预测性能方面的优越性。

Jul, 2023

反事实公平表达

在这项研究中，我们提出了一种使用所有可用特征进行训练的新算法，从理论和实证方面证明了使用该方法训练的模型能够满足 Counterfactual Fairness。

Nov, 2023

反事实公平机会：利用反事实推理测量决策模型公平性

本研究提出一种利用反事实推理揭示机器学习和去偏见模型不公平行为的方法，在三个不同数据集上获得验证。

Feb, 2023

揭示反事实解释在就业能力的潜力

本研究提出反事实解释在复杂机器学习算法下的应用，以数据实例展示其在雇用相关问题中提高决策支持、遵守法律要求、引导受控变更和分析新颖洞见的作用。

May, 2023

利用基数约束生成反事实解释

提供关于机器学习算法如何工作和 / 或进行特定预测的解释是改善其可靠性、公平性和鲁棒性的主要工具之一。在解释类型中，反事实是最直观的一种，它是与给定点仅在预测目标和某些特征上不同的示例，它呈现了原始示例中需要改变的特征来翻转该示例的预测。然而，这种反事实可能具有与原始示例不同的许多不同特征，使得其解释困难。在本文中，我们提出明确为反事实生成添加一个基数约束，限制与原始示例不同的特征数量，从而提供更易解释和易理解的反事实。

Apr, 2024