减轻二元分类中的非线性算法偏差

Dec, 2023

减轻二元分类中的非线性算法偏差

Mitigating Nonlinear Algorithmic Bias in Binary Classification

Wendy Hui, Wai Kwong Lau

TL;DR该论文提出使用因果建模来检测和减轻与受保护属性非线性相关的算法偏差。我们使用了 UC Irvine 机器学习库中提供的 German Credit 数据集来开发 (1) 一个被视为黑盒的预测模型和 (2) 用于偏差减轻的因果模型。我们聚焦于年龄偏差和二分分类问题。我们展示了年轻人被正确分类为 “低风险” 的概率最低，随着年龄的增长，这个概率非线性增加。为了将非线性纳入因果模型，我们引入了一个高阶多项式项。基于拟合的因果模型，计算出了被消除偏差的概率估计，显示了改善的公平性，对整体分类准确性影响较小。因果建模直观易懂，其使用可以增强解释性并提升 AI 的不同利益相关者之间的信任。

Abstract

This paper proposes the use of causal modeling to detect and mitigate algorithmic bias that is nonlinear in the protected attribute. We pr

causal modeling algorithmic bias protected attribute age bias binary classification

发现论文，激发创造

使用因果建模检测和减轻二元分类中的算法偏见

利用因果建模来检测和减轻算法偏差，本文针对性别偏见和二分类问题，使用成年人数据集通过建立预测模型和因果模型，证明了预测模型中的性别偏见在 0.05 水平上显著，并通过交叉验证展示了因果模型减轻性别偏见的效果并略微提高了整体分类准确度，该方法直观易用，可使用现有统计软件工具如 R 中的 “lavaan” 实现，提高解释性并促进信任。

Oct, 2023

公平预测算法的统计框架

本文提出了通过从可允许的训练数据中去除保护变量的所有信息来消除预测模型偏见的方法，并将其应用于罪犯记录的数据集以产生种族中立的再逮捕预测方案，证明了将种族作为协变量省略的方式仍导致存在种族差异，并且证明了应用我们提出的方法可以将这些数据中的种族差异从预测中去除，并对预测准确性的影响最小。

Oct, 2016

解剖因果偏见

准确测量在基于机器学习的自动决策系统中的歧视是解决子群体和 / 或个体间公平性的重要问题所必需的。本文关注于在生成和 / 或收集训练数据的方式中出现的一类偏见，我们称之为因果偏见，并使用因果关系领域的工具来正式定义和分析此类偏见。本文考虑了四种来源的偏见，即混杂、选择、测量和交互。本文的主要贡献是为每种偏见提供了一个基于模型参数的闭合表达式。这使得分析每种偏见的行为成为可能，特别是在哪些情况下它们不存在，以及在哪些其他情况下它们被最大化。我们希望提供的特征有助于社会更好地理解机器学习应用中偏见的来源。

Oct, 2023

在 NLP 模型中同时解决统计性别公平性和因果性别公平性

本研究评估了性别偏见的 NLP 模型的统计和因果去偏方法，发现这些方法在目标度量上有效减少了偏见，但不一定改善了其他偏见度量的结果。同时，我们展示了统计和因果去偏技术的组合能够减少通过两种类型的度量来衡量的偏见。

Mar, 2024

一种移除敏感信息的算法应用于独立于种族的再犯罪预测

本文提出了一种概率算法偏见的方法，通过消除模型将要训练的数据中所有关于保护变量的信息来消除模型中的偏见。我们将我们的方法应用于一个关于罪犯在被判决时的犯罪历史数据集，并证明了一种创建 “种族中立” 模型的常见方法 - 即忽略种族作为协变量 - 仍然会导致种族差异预测。最后，我们证明了采用我们提出的方法可以最小限度地对预测精度产生影响，同时消除预测中的种族差异。

Mar, 2017

针对二分类决策系统的偏见缓解方法：调查和建议

本文对偏见缓解方法进行了系统概述，报告了其优点和局限性，并为二元分类的未来偏见缓解方法的开发提供建议。

May, 2023

非线性不变风险最小化：一种因果方法

提出了一种不变因果表示学习 (iCaRL) 方法，通过利用广义指数族分布得出数据表示，可以在非线性场景中实现超出分布的泛化，并发现目标的全部直接原因，针对合成和真实数据集提出性能优于基线方法的实验结果。

Feb, 2021

具有因果正则化的学习：对数据选择偏差的不可知性处理

本文基于因果关系假设，将因果技术纳入预测建模中，提出一种新的因果正则化逻辑回归（Causally Regularized Logistic Regression，CRLR）算法，以共同优化全局混杂因素平衡和加权逻辑回归，以解决对假设的无知选择偏差对实际应用中的稳健模型学习的重要性问题。

Aug, 2017

模型适应的去偏算法

提出了一种用于检测和减轻语言模型中性别偏见的新方法，通过因果分析确定了问题模型组件，发现中上部前馈层最容易传递偏见，根据分析结果通过线性投影来改进模型，该方法（DAMA）显著减少了偏见，并保持了模型在下游任务上的性能。

Oct, 2023

使用反事实推论的因果视角评估和缓解图像分类器中的偏差

该研究提出了一种利用结构原因模型和 ALI 生成对抗学习算法，生成能满足图像属性之间因果关系约束的反事实例，用于解释和评估神经网络模型的偏差，并使用反事实正则化方法消除分类器训练数据中对皮肤和头发颜色等多维属性的偏见。

Sep, 2020