在平衡数据以实现公平性或鲁棒性时，注意图形

Jun, 2024

在平衡数据以实现公平性或鲁棒性时，注意图形

Mind the Graph When Balancing Data for Fairness or Robustness

Jessica Schrouff, Alexis Bellot, Amal Rannen-Triki, Alan Malek, Isabela Albuquerque...

TL;DR机器学习中公平性或鲁棒性的失败可能源于协变量、结果和辅助因素之间的不希望的依赖关系。数据平衡是缓解这些问题的常见策略，但往往无法选择性地消除任务的因果图中的不希望依赖关系，导致多种失败模式，甚至干扰正则化等其他缓解技术。因此，在进行数据平衡之前，考虑因果图是非常重要的。

Abstract

failures of fairness or robustness in machine learning predictive settings can be due to undesired dependencies between covariates, outcom

failures of fairness robustness machine learning data balancing causal graph

发现论文，激发创造

关于对抗偏差和公正机器学习的鲁棒性

为保证公正性，公平机器学习算法致力于消除不同群体间的行为差异，但是研究表明，在训练数据存在偏差的情况下，将同等的重视不同规模和分布的不同群体，可能会与鲁棒性相冲突，攻击者可以通过对样本和标签的控制来攻击群体公平性机器学习，从而在测试数据上显著降低测试准确率，本文评估了多种算法和基准数据集的攻击，分析了公平机器学习的鲁棒性。

Jun, 2020

数据集平衡的局限性：对抗虚假相关的失败战役

本观点文章指出，解决数据集平衡问题的常见方法已经不足以避免深度学习模型对小规模数据和特定标签的依赖和过拟合问题。我们提出了多种替代方法，包括增强数据集上下文语境，使用少量样本训练模型，通过与用户交互的方式进行模型推理等。

Apr, 2022

使用平衡权重进行反事实表示学习

本文介绍了在因果推断中使用加权重来实现预测功能的平衡，强调了确定合适的目标人群的重要性，并使用引理将平衡与倾向性评估的质量联系起来，最终展示了学习到的加权表示如何促进具有吸引力统计特征的替代因果学习过程。

Oct, 2020

算法公平中建模数据缺失的重要性：因果视角

本文使用因果图的方法，研究了机器学习中缺失数据的情况对公平性算法的影响，提出了一个算法可在多阶段决策中实现分散决策的同时保持性能相似。

Dec, 2020

数据受限二元分类中平衡公平性与准确性

在处理敏感信息的应用程序中，数据限制可能会对机器学习（ML）分类器的可用数据施加限制，本文提出了一个框架，模拟了在四种实际情景下准确性和公平性之间的折衷，以确定在各种数据限制情况下，贝叶斯分类器的准确性受到的影响是如何的。

Mar, 2024

公平混合效应支持向量机

机器学习中的公平性与聚类数据对公平机器学习预测的影响，以及一种能够同时处理这两个问题的公平混合效应支持向量机算法。

May, 2024

基于核心因果平衡的无偏协同过滤

通过在可观测数据集中消除不同的偏差，去偏协同过滤旨在学习一个无偏的预测模型。本文通过重新加权观测样本分布以适应目标样本的倾向得分来解决此问题。为了更好地满足因果平衡约束条件，作者提出了一种近似平衡函数的方法，并在再生核希尔伯特空间中证明了其更好满足因果平衡约束条件的能力。同时，作者提出了一种自适应平衡核函数的算法，并理论上分析了方法的泛化误差界。通过广泛的实验证明了该方法的有效性。

Apr, 2024

通过将数据转化为与偏差正交的方式实现反事实公平性

介绍了一种新的数据预处理算法 Orthogonal to Bias (OB)，旨在消除连续敏感变量的影响，从而实现机器学习应用中的反事实公平性，并通过模拟和实际数据集的实证评估证明该方法能够在不损害准确性的情况下实现更加公平的结果。

Mar, 2024

公平性对于最优传输的边缘预测

本文主要研究了图中预测任务的算法公正问题，提出了一种嵌入不可知的修复过程以实现组内和个体的公正权衡，并在实验中验证了该方法对不同公正概念和预测准确性的显式控制能力。

Oct, 2020

机器学习中的公平性

讨论如何使用因果贝叶斯网络和最优输运理论来处理机器学习公平性问题，尤其是在复杂的不公平场景下，提出了一种统一的框架来处理不同的情况和公平标准，并介绍了一种学习公平表示的方法和一种考虑敏感属性使用限制的技术。

Dec, 2020