Dec, 2023

减轻二元分类中的非线性算法偏差

TL;DR该论文提出使用因果建模来检测和减轻与受保护属性非线性相关的算法偏差。我们使用了 UC Irvine 机器学习库中提供的 German Credit 数据集来开发 (1) 一个被视为黑盒的预测模型和 (2) 用于偏差减轻的因果模型。我们聚焦于年龄偏差和二分分类问题。我们展示了年轻人被正确分类为 “低风险” 的概率最低,随着年龄的增长,这个概率非线性增加。为了将非线性纳入因果模型,我们引入了一个高阶多项式项。基于拟合的因果模型,计算出了被消除偏差的概率估计,显示了改善的公平性,对整体分类准确性影响较小。因果建模直观易懂,其使用可以增强解释性并提升 AI 的不同利益相关者之间的信任。