交叉不公平发现

ICMLMay, 2024

Intersectional Unfairness Discovery

Gezheng Xu, Qi Chen, Charles Ling, Boyu Wang, Changjian Shui

TL;DRAI 系统在特定人群中产生不公平结果，需要理解特定敏感属性上的偏见。本文通过发现交叉敏感属性下多样化的高偏见子群体，提出了一种基于偏见引导的生成网络（BGGN）。通过将每个偏见值视为奖励，BGGN 可以高效地生成高偏见的交叉敏感属性。实验证明 BGGN 在现实世界的文本和图像数据集上具有多样性且高效的发现能力。进一步评估生成的未见但可能存在不公平的交叉敏感属性，我们将其建模为提示，并使用现代生成型人工智能生成新的文本和图像。频繁生成偏见数据的结果为发现流行现代生成型人工智能系统中潜在的不公平提供了新的见解。警告：本文包含具有冒犯性的生成示例。

Abstract

ai systems have been shown to produce unfair results for certain subgroups of population, highlighting the need to understand bias on cert

ai systems unfair results bias intersectional sensitive attributes bggn

发现论文，激发创造

分类问题中审计和实现交叉公平性

本文研究关于机器学习中的公平性问题，针对多种敏感属性，提出了应对交叉性公平性偏差的方法，定义了一系列评估数据或模型输出结果公平性的指标，并开发了后处理技术来减轻分类模型的交叉性偏差。这些技术不依赖于底层模型的任何假设，并可以保持公平性和预测性能的平衡。最后，展示了在实际数据集上提出的方法的有效性。

Nov, 2019

机器学习中交叉公平性综述：概念、缓解和挑战

在一个综述中，作者回顾了交叉公平的最新进展并提供了分类法和矫正算法以缓解交叉偏差，最后指出研究者未来的研究方向和挑战。

May, 2023

公平的交集定义

本研究提出了机器学习和人工智能系统中的公平性定义，并受到交叉性别、种族、性取向、阶级和残疾等影响因素的启发，通过保护属性子集合理分配资源，提供合理保护算法，同时在人口普查数据和 COMPAS 犯罪再犯数据集上进行案例研究。

Jul, 2018

交叉公平性：分形方法

通过在超立方体的几何设置下，将交叉公平问题分层分析，证明了公平并不向下传递，但会向上传递，探讨了公平作为自相似、分形、关联属性在人工智能中的自然涌现。

Feb, 2023

一尺之法：面向多种敏感属性的公正图神经网络学习

最近的研究强调了图神经网络（GNN）中的公平性问题，即 GNN 针对被敏感属性（如种族和年龄）分类的特定保护群体产生了歧视性预测。针对这个问题的不同努力取得了显著进展，但往往专门针对特定的敏感属性，因此需要从头开始对模型进行重新训练以满足敏感属性需求的变化，导致高计算成本。为了更深入地了解这个问题，我们从因果建模的视角来考虑图公平性问题，认为敏感属性引起的混淆效应是其根本原因。出于这一观察的动机，我们从不变学习的角度来公式化图公平性问题，旨在学习跨环境的不变表示。因此，我们提出了一个基于不变学习的图公平性框架，名为 FairINV，它能够在单个训练会话中训练公平的 GNN 模型以适应多种敏感属性。具体而言，FairINV 通过将敏感属性进行划分，并消除标签与各种敏感属性之间的虚假相关性来训练公平的 GNN 模型。在几个真实数据集上的实验证明，FairINV 在公平性方面明显优于最先进的方法，突出了其有效性。我们的代码可通过此 https://URL 获得。

Jun, 2024

评估化解交叉偏见技术

这篇论文探讨了在自然语言处理模型中的偏差对模型的影响，提出了针对多个保护属性进行评估的自动去偏差技术，并研究了一个新的有偏约束模型及其扩展版本的迭代零空间投影技术。

Sep, 2021

交叉公平的贝叶斯建模：偏差的方差

本文针对交织系统对包括种族、性别、性取向、阶级和残疾等方面影响个体的观点，提出了一种皮尔逊贝塔贝叶斯概率建模方法，来对多重受保护属性的公正性进行可靠、高效的估算，以及模型建立和公正性测量的实用性解决方案。

Nov, 2018

基于结构回归的模型性能评估方法在交叉子群中的应用

通过引入结构回归方法进行细分评估，以演示即使对于非常小的子群体，也可以得出可靠的系统性能估计，进而提供相应的推断策略以构建置信区间，并探索拟合度检验如何揭示交叉群体所经历的公平相关伤害的结构。

Jan, 2024

公平先验：改进深度神经网络公平性偏向子群发现

深度学习的公平性测试和消除方面的研究广泛应用于软件系统，然而，对交叉偏见的探测和处理相对较少，本文介绍了一种名为 Fairpriori 的新型偏见子群发现方法，该方法在有效率地计算交叉偏见的公平性度量的基础上，支持多种用例，易于使用和解释，并具有较高的计算效率。

Jun, 2024

使用最坏情况比较来特征化交叉群体公平性

本文旨在探讨机器学习或人工智能算法因本身的偏见与成见会影响其输出结果的问题，分析现有关于交叉区域公平性的定义和衡量指标，并提出了一个简单的最坏情况比较方法来扩展现有群体公平指标的定义以涵盖交叉区域，最后讨论了处理关于交叉区域公平的社会、法律和政治框架。

Jan, 2021