本研究探讨了缺失数据补全方法的公平性,发现缺失值补全在敏感群体中存在公平性问题,因此有必要对相关因素进行仔细研究,以减少与缺失数据补全相关的不公平性。
Oct, 2021
本文旨在研究如何在机器学习中处理缺失数据,以提高公平性决策的准确性,发现缺失数据与数据偏差现象紧密相关,而此前的研究却没有充分考虑缺失数据问题。
May, 2019
本文探讨了在机器学习过程中常被忽略的数据预处理步骤 —— 数据填补,对医疗领域存在的偏见和影响较大的群体不平等性产生的影响,并提出了缓解不平等的建议。
Aug, 2022
本文比较了不同的方法在监督分类任务中填补缺失分类数据的效果,并证明了方法可以提高预测准确性,并达到了 Missing-data perturbation 和 k-nearest-neighbors imputation 下准确率的最新水平。
Oct, 2016
本文系统评估了处理缺失值的策略在预测模型中的效果,重点关注大型健康数据库,结果表明,在监督式机器学习中自然支持的缺失值预测表现优于最先进的插补方法,且计算成本更低。
Feb, 2022
本文使用因果图的方法,研究了机器学习中缺失数据的情况对公平性算法的影响,提出了一个算法可在多阶段决策中实现分散决策的同时保持性能相似。
Dec, 2020
通过概率插值敏感特征并联合学习组条件缺失概率的变分自编码器,我们提出了公平感知分类模型,以解决隐私、法律问题和个体恐惧所导致的敏感特征全知要求的实际不可行性问题,我们的模型在图像和表格数据集上表现出较好的准确性和公平性平衡。
Feb, 2024
本文提出了一种统一的方法,以验证数据插补对于学习准确模型是否必要,并在插补不必要的情况下返回准确模型。通过我们的算法,可以显著减少数据插补所需的时间和工作量,并且不会带来明显的计算负担。
本文介绍了一种在解决缺失数据问题时使用可解释机器学习的方法。将高精度的玻璃盒可解释性增强机(EBMs)用于缺失值处理,可帮助用户更好地了解缺失机制并检测可能引入的风险。实验表明了该方法在处理真实医疗数据集时的有效性。
Apr, 2023
研究机器学习如何处理公平性和防止基于敏感属性的预测性歧视问题,并提出一种名为 AdaFair 的基于 AdaBoost 分类器的方法,该方法显式地处理类别不平衡并在维持分类准确性的同时优化公平性,实验证明其在平衡错误方面比现有的公平性方法表现显著好 25%。
Sep, 2019