审计交叉偏见的预测模型

Jun, 2023

Auditing Predictive Models for Intersectional Biases

Kate S. Boxer, Edward McFowland III, Daniel B. Neill

TL;DR提出了一种灵活的审计框架 Conditional Bias Scan (CBS)，以检测分类模型中的交叉偏见，该方法可以检测到先前未发现的交叉和上下文相关偏见，并且相对于仅审计子组公平性的类似方法具有更高的偏见检测能力。

Abstract

Predictive models that satisfy group fairness criteria in aggregate for members of a protected class, but do not guarantee subgroup fairness

group fairness protected class subgroup fairness intersectional biases classifications models

发现论文，激发创造

分类器中的显著性预测偏差识别

介绍了一种新颖的子集扫描方法，用于检测统计学显著的偏差或区域，以及识别分类器偏差或预测不良的特征子集，该方法使用基于子集扫描和参数引导的方法处理了指数级可能的子集。

Nov, 2016

分类问题中审计和实现交叉公平性

本文研究关于机器学习中的公平性问题，针对多种敏感属性，提出了应对交叉性公平性偏差的方法，定义了一系列评估数据或模型输出结果公平性的指标，并开发了后处理技术来减轻分类模型的交叉性偏差。这些技术不依赖于底层模型的任何假设，并可以保持公平性和预测性能的平衡。最后，展示了在实际数据集上提出的方法的有效性。

Nov, 2019

预测敏感性：部署的分类器中反事实公平性的持续审计

该研究提出了一种基于预测敏感性的方案，用于对已部署的分类器进行持续审计，以识别反对事实上的公正性。该方案不需要保护状态信息的预测时间，可以利用保护状态和其他特征之间的相关性，并展示了该方法有效检测反对事实上公正性的违规情况。

Feb, 2022

超越你所见：使用种族健康不平等社会决定因素对多标签胸部 X 射线分类进行子群交叉公平性的实证分析

通过使用深度学习模型，本研究在疾病诊断方面取得了重要进展，在使用胸部 X 射线上具有很大潜力。然而，这些模型中存在的固有偏见可能导致预测准确性在不同保护组之间存在差异。为了实现准确的诊断结果并确保在交叉组之间公平性，我们提出了一个框架，用于在高维胸部 X 射线多标签分类任务中实现公平性。该框架不仅考虑传统的受保护属性，还考虑了社会决定因素中的复杂交互作用，使得公平性的评估更加细致。我们提出了一种简单而强大的方法，通过使用跨组平衡的数据集来重新训练预训练模型的最后分类层。此外，我们还考虑了公平性约束，并在多标签设置中集成了类别平衡微调。我们在 MIMIC-CXR 数据集上评估了我们的方法，结果表明与基准方法相比，我们的框架在准确性和公平性之间实现了最佳权衡。

Mar, 2024

利用数据组合评估隐含保护类别的算法公正性

本文研究了评估算法决策的不平等影响面临的根本性挑战：保护类成员在数据中通常不可观察。研究者考虑使用附加数据集来构建模型，从而预测代理变量（如姓氏和地理位置）来确定受保护类别的成员身份，提供了计算和可视化这些集合的算法和统计工具。通过借助美国人口普查数据和两个真实案例（抵押贷款和个性化药物剂量），展示了这种方法可以实现可靠和稳健的不平等影响评估。

Jun, 2019

预测模型中潜在的传播采样偏差可证明检测

本文研究了在从（可能有偏见的）训练数据中学习预测模型，并通过某种审计方法事后评估公平性的一般性情况，通过定量而非定性地评估数据偏差的下游影响并证明检测的理论保证。

Feb, 2023

如何捕捉交叉公平性

本文提出了一种新的框架 ——α 交叉公平（Intersectional Fairness）框架，来解决交叉敏感群体的分类问题，提出了一种新的公平度量，并在实验中验证了该框架的有效性以及一些算法的有效性。

May, 2023

评估化解交叉偏见技术

这篇论文探讨了在自然语言处理模型中的偏差对模型的影响，提出了针对多个保护属性进行评估的自动去偏差技术，并研究了一个新的有偏约束模型及其扩展版本的迭代零空间投影技术。

Sep, 2021

机器学习中交叉公平性综述：概念、缓解和挑战

在一个综述中，作者回顾了交叉公平的最新进展并提供了分类法和矫正算法以缓解交叉偏差，最后指出研究者未来的研究方向和挑战。

May, 2023

基于结构回归的模型性能评估方法在交叉子群中的应用

通过引入结构回归方法进行细分评估，以演示即使对于非常小的子群体，也可以得出可靠的系统性能估计，进而提供相应的推断策略以构建置信区间，并探索拟合度检验如何揭示交叉群体所经历的公平相关伤害的结构。

Jan, 2024