基于 Wasserstein 的机器学习模型公平性解释框架

Nov, 2020

基于 Wasserstein 的机器学习模型公平性解释框架

Wasserstein-based fairness interpretability framework for machine learning models

Alexey Miroshnikov, Konstandinos Kotsiopoulos, Ryan Franks, Arjun Ravi Kannan

TL;DR本文介绍了一种公平解释性框架，用于在分布级别上测量和解释分类和回归模型中的偏见。通过使用 Wasserstein 度量，在模型输出的亚群分布上测量模型偏差，考虑模型和预测变量相对于非受保护类的有利性，使用运输理论进行量化，并通过博弈理论的技术实现偏见解释的可加性。

Abstract

The objective of this article is to introduce a fairness interpretability framework for measuring and explaining the bias in classification and regression models at the level of a distribution. In our work, we me

fairness interpretability framework bias measurement classification regression transport theory

发现论文，激发创造

基于 Wasserstein 独立性的公平文本分类

该论文提出了一种新的方法来减轻神经文本分类中的偏见，它能够在处理公正性问题时不需要敏感属性的注释，与现有的方法相比具有可比较或更好的公正性和准确性权衡。

Nov, 2023

一种分布鲁棒的公平分类方法

提出了一种具有不公平惩罚的分布鲁棒逻辑回归模型，可以使用 Wasserstein ball 来对分布不确定性进行建模以实现公平机会并提高公平性。

Jul, 2020

Wasserstein 公平分类

我们提出了一种公平分类的方法，通过最小化 Wasserstein-1 距离来强制执行分类器输出和敏感信息之间的独立性。我们引入了不同的方法，在测试时隐藏敏感信息，或具有简单快速的实现，并展示了在多个基准公平性数据集上与不同公平性基线的实证表现。

Jul, 2019

通过 Wasserstein Barycenters 实现多任务学习的公平性

本文提出一种用于多任务学习的算法公平性方法，该方法通过使用多项 Wasserstein barycenter 扩展 “Strong Demographic Parity” 的定义，为具有回归和二分类任务的多任务学习器提供了封闭形式解决方案，并应用于合成和现实数据集上以展示其在促进公平决策方面的实际价值。

Jun, 2023

Wasserstein 双凸权重平均的公平回归

通过公平回归和最优输运理论的联系，得到一种最优公平的预测器，并建议了一个简单的后处理算法来实现公平。这个结果提出了最优公平预测的直观解释，并为这个过程建立了风险和无分布的公平保证。

Jun, 2020

连续分数的可解释分布不变公平度量

通过分布不变公平性度量，我们提出了一套对连续计分进行公平性度量的方法，该方法基于 Wasserstein 距离，具有合理的解释性，并且适用于量化和解释群组差异的强度，以及在不同模型、数据集或时间点之间比较偏差。我们还证明了这些度量的有效性，通过对常用公平性基准数据集的实验验证。

Aug, 2023

利用最优传输解决图像分类中的公平性和可解释性问题

算法公平性和不公平结果的可解释性对于在医疗保健和执法等领域建立人工智能系统的信任和问责是至关重要的。我们提出了一种基于最优运输理论的全面方法，通过发现图像中有偏差区域的原因和影响来建立模型的解释性。这些发现对于开发值得信赖、公正的 AI 系统，在各个领域的决策中提供透明、问责和公平具有重要意义。

Aug, 2023

解释性之路的通行需面对偏见：衡量解释的公平性

本文通过在金融、医疗保健、大学招生和美国司法系统等四个领域的实际数据中审计了不同保护子组的解释质量，发现不同子组的近似质量显着不同，而解释深度学习模型的近似质量差异存在着公平性挑战，需要进一步解决。

May, 2022

以 Wasserstein 距离为指导的对抗性权重调整用于偏见缓解

通过对抗再加权方法来解决机器学习中的表征偏差，平衡数据分布以减少对少数群体的不公正对待，从而提高分类准确性和公平性。

Nov, 2023

公平性和可解释性：缩小公平模型解释的差距

通过解释的方式，我们提出了基于过程的公正度并识别了过程相关偏见，并通过优化目标设计了一种综合公正度算法，以在提高传统公正度、满足解释公正度和维护实用性能之间达到多重目标的平衡。

Dec, 2022