公平性与缺失值

May, 2019

Fairness and Missing Values

Fernando Martínez-Plumed, Cèsar Ferri, David Nieves, José Hernández-Orallo

TL;DR本文旨在研究如何在机器学习中处理缺失数据，以提高公平性决策的准确性，发现缺失数据与数据偏差现象紧密相关，而此前的研究却没有充分考虑缺失数据问题。

Abstract

The causes underlying unfair decision making are complex, being internalised in different ways by decision makers, other actors dealing with data and models, and ultimately by the individuals being affected by these decisions. One frequent manifestation of all these latent causes arise

missing data bias fairness decision making machine learning

发现论文，激发创造

缺失数据填补中的公平性

本研究探讨了缺失数据补全方法的公平性，发现缺失值补全在敏感群体中存在公平性问题，因此有必要对相关因素进行仔细研究，以减少与缺失数据补全相关的不公平性。

Oct, 2021

适应缺失值的公平干预

该论文研究了缺失数据对算法公平性的影响，并提出了一种可扩展和自适应的公平分类算法来处理所有可能的缺失模式，以保留缺失模式中编码的信息，并在多个数据集上实验证明该算法相比于传统的 impute-then-classify 方法在公平性和准确性上具有优势。

May, 2023

算法公平中建模数据缺失的重要性：因果视角

本文使用因果图的方法，研究了机器学习中缺失数据的情况对公平性算法的影响，提出了一个算法可在多阶段决策中实现分散决策的同时保持性能相似。

Dec, 2020

机器学习中的公平性

讨论如何使用因果贝叶斯网络和最优输运理论来处理机器学习公平性问题，尤其是在复杂的不公平场景下，提出了一种统一的框架来处理不同的情况和公平标准，并介绍了一种学习公平表示的方法和一种考虑敏感属性使用限制的技术。

Dec, 2020

懒散的数据处理方式对公正研究的危害

数据实践塑造了公平机器学习研究和实践。关键数据研究通过指出不足并提出改进建议，为该领域的负责前进提供了重要的反思和批评。本研究对公平机器学习数据集进行了全面分析，展示了不经思考的常见实践如何阻碍算法公平研究的覆盖率和可靠性。我们对表格数据集中编码的保护信息以及在 142 篇出版物的 280 个实验中的使用进行了系统研究，发现了三个主要问题：（1）数据和评估中某些保护属性的缺乏代表性；（2）数据预处理过程中普遍排除少数群体；以及（3）威胁公平性研究泛化的模糊数据处理。通过在显著数据集的利用上进行示范性分析，我们展示了不经思考的数据决策如何不成比例地影响少数群体、公平度量和模型比较结果。此外，我们还发现了公开可用数据的限制、隐私考虑以及普遍缺乏意识等补充因素，加剧了这些挑战。为了解决这些问题，我们提出了一套以透明和负责任包容为核心的数据使用建议。本研究强调了对公平机器学习中数据实践进行关键重新评估的必要性，并提供了改善数据的获取和使用的方向。

Apr, 2024

关于公平感知机器学习数据集的调查

本文概述了应用于公平感知机器学习中的真实世界数据集，并使用贝叶斯网络分析数据特征之间的关系，进一步进行了探索性分析。

Oct, 2021

通过模型和数据偏差交互理解欺诈检测中的不公平性

机器学习算法应用广泛，但也可能存在偏见和不公平。本研究提出了一种刻画数据偏见的分类法，并探究了算法的不公平和精度之间的权衡。实证研究表明，在不同的数据偏见设置下，算法的公平性和精度会受到不同的影响，而简单的预处理干预技术可以提高算法的公平性。

Jul, 2022

机器学习中的公平性：一项调查

这篇文章介绍了机器学习中的社会偏见和公平性问题，总结了预处理、处理和后处理等多种方法，包含二分类、回归、推荐系统、无监督学习和自然语言处理等多个方面，同时提供了多个开源库。最后，列举了公平性研究的四个难题。

Oct, 2020

公平性概念及相关紧张关系综述

本文旨在调查研究自动化决策系统中机器学习算法存在的偏差及其与公平、隐私和分类准确性之间的关系，并综述了处理公平 - 准确性权衡的不同方法。作者通过实验分析了公平度量和准确度在现实世界场景中的关系。

Sep, 2022

公平混合效应支持向量机

机器学习中的公平性与聚类数据对公平机器学习预测的影响，以及一种能够同时处理这两个问题的公平混合效应支持向量机算法。

May, 2024