May, 2024

消除偏见的偏见决策模型比较:基于抵押贷款申请数据的方法对比

TL;DR通过对房屋贷款申请决策的真实数据添加反事实(模拟)种族偏见,本文展示了即使没有将族裔作为预测变量,机器学习模型(XGBoost)仍然会重复这种偏见。接下来比较了几种去偏方法:禁止变量的平均值、在禁止变量中选择最优预测(一种新方法)以及同时最小化误差和预测与禁止变量之间的关联。去偏可以恢复部分原始决策,但结果对于偏见是否通过代理方式产生是敏感的。