适应缺失值的公平干预

May, 2023

Adapting Fairness Interventions to Missing Values

Raymond Feng, Flavio P. Calmon, Hao Wang

TL;DR该论文研究了缺失数据对算法公平性的影响，并提出了一种可扩展和自适应的公平分类算法来处理所有可能的缺失模式，以保留缺失模式中编码的信息，并在多个数据集上实验证明该算法相比于传统的 impute-then-classify 方法在公平性和准确性上具有优势。

Abstract

missing values in real-world data pose a significant and unique challenge to algorithmic fairness. Different demographic groups may be unequally affected by missing data, and the standard procedure for handling <

missing values algorithmic fairness impute-then-classify group fairness fair classification

发现论文，激发创造

缺失数据填补中的公平性

本研究探讨了缺失数据补全方法的公平性，发现缺失值补全在敏感群体中存在公平性问题，因此有必要对相关因素进行仔细研究，以减少与缺失数据补全相关的不公平性。

Oct, 2021

公平性与缺失值

本文旨在研究如何在机器学习中处理缺失数据，以提高公平性决策的准确性，发现缺失数据与数据偏差现象紧密相关，而此前的研究却没有充分考虑缺失数据问题。

May, 2019

临床存在下的填补策略：对算法公平性的影响

本文探讨了在机器学习过程中常被忽略的数据预处理步骤 —— 数据填补，对医疗领域存在的偏见和影响较大的群体不平等性产生的影响，并提出了缓解不平等的建议。

Aug, 2022

监督学习的缺失数据插补

本文比较了不同的方法在监督分类任务中填补缺失分类数据的效果，并证明了方法可以提高预测准确性，并达到了 Missing-data perturbation 和 k-nearest-neighbors imputation 下准确率的最新水平。

Oct, 2016

基于健康数据库的预测模型缺失值处理方法的基准测试

本文系统评估了处理缺失值的策略在预测模型中的效果，重点关注大型健康数据库，结果表明，在监督式机器学习中自然支持的缺失值预测表现优于最先进的插补方法，且计算成本更低。

Feb, 2022

算法公平中建模数据缺失的重要性：因果视角

本文使用因果图的方法，研究了机器学习中缺失数据的情况对公平性算法的影响，提出了一个算法可在多阶段决策中实现分散决策的同时保持性能相似。

Dec, 2020

组条件缺失人口的公平风险

通过概率插值敏感特征并联合学习组条件缺失概率的变分自编码器，我们提出了公平感知分类模型，以解决隐私、法律问题和个体恐惧所导致的敏感特征全知要求的实际不可行性问题，我们的模型在图像和表格数据集上表现出较好的准确性和公平性平衡。

Feb, 2024

统计学习中的确定性和近似确定性模型

本文提出了一种统一的方法，以验证数据插补对于学习准确模型是否必要，并在插补不必要的情况下返回准确模型。通过我们的算法，可以显著减少数据插补所需的时间和工作量，并且不会带来明显的计算负担。

Feb, 2024

医疗数据中的缺失值和填补：可解释机器学习能提供帮助吗？

本文介绍了一种在解决缺失数据问题时使用可解释机器学习的方法。将高精度的玻璃盒可解释性增强机（EBMs）用于缺失值处理，可帮助用户更好地了解缺失机制并检测可能引入的风险。实验表明了该方法在处理真实医疗数据集时的有效性。

Apr, 2023

AdaFair: 累积公平自适应提升算法

研究机器学习如何处理公平性和防止基于敏感属性的预测性歧视问题，并提出一种名为 AdaFair 的基于 AdaBoost 分类器的方法，该方法显式地处理类别不平衡并在维持分类准确性的同时优化公平性，实验证明其在平衡错误方面比现有的公平性方法表现显著好 25％。

Sep, 2019