算法公平度 - 准确性权衡研究中的突发不公

Feb, 2021

算法公平度 - 准确性权衡研究中的突发不公

Emergent Unfairness in Algorithmic Fairness-Accuracy Trade-Off Research

A. Feder Cooper, Ellen Abrams

TL;DR该文探讨了机器学习中的公平性与准确性的权衡以及该领域中存在的数学假设，认为这些假设可能导致不一致的结论和潜在的不公平性，并提出了解决方案。

Abstract

Across machine learning (ML) sub-disciplines, researchers make explicit mathematical assumptions in order to facilitate proof-writing. We note that, specifically in the area of →

machine learning fairness-accuracy trade-off optimization mathematical assumptions modeling fairness emergent unfairness

发现论文，激发创造

机器学习在公共政策领域中公平性和准确性之间取得的可忽略权衡的经验观察

使用机器学习来减少公平性差异和确保准确性在真实世界中的平衡是政策制定者关注的问题，本文通过实证研究发现，在教育、心理健康、刑事司法和住房安全等领域中使用后期处理措施来解决公平性问题，能够显著提高公平性而不牺牲准确性，实现在政策中使用机器学习的目的。

Dec, 2020

任意性超越公平 - 准确度前沿线

机器学习中的公平干预可能会加剧预测复杂性，而提出了一种可应用于任何公平干预的集成算法来解决挑战并确保更一致的预测。

Jun, 2023

公平机器学习的错误基础

该研究讨论了在自动化决策中公平性的概念和实现方式，并说明了当前的公平机器学习范式中存在的错误推理、误导性陈述和可疑做法，并探讨了在存在群体差异的任何数据设置中，统计上准确结果和群体相似结果之间的权衡存在，并对未来的相关领域提出了建议。

Jun, 2023

公平精确性平衡下的内在公平性 - 准确性权衡

机器学习在执法、刑事司法、金融、招聘和招生等领域的日益广泛应用，确保机器学习辅助决策的公平性变得越来越关键。本文以统计学的 “平等机会” 概念为基础，研究了公平性和准确性之间的折衷。我们提出了一个新的准确性上限（适用于任何分类器），并将其作为公平预算的函数。此外，我们的上限还与数据、标签和敏感群体属性的底层统计学关系密切相关。通过对三个真实世界数据集（COMPAS、成年人和法学院）进行经验分析，我们验证了我们理论上限的有效性。具体而言，我们将我们的上限与文献中各种现有公平分类器所实现的折衷情况进行了比较。我们的结果表明，在统计差异存在的情况下，实现高准确性条件下的低偏差可能从根本上受到限制。

May, 2024

通过模型和数据偏差交互理解欺诈检测中的不公平性

机器学习算法应用广泛，但也可能存在偏见和不公平。本研究提出了一种刻画数据偏见的分类法，并探究了算法的不公平和精度之间的权衡。实证研究表明，在不同的数据偏见设置下，算法的公平性和精度会受到不同的影响，而简单的预处理干预技术可以提高算法的公平性。

Jul, 2022

机器学习中的公平性

讨论如何使用因果贝叶斯网络和最优输运理论来处理机器学习公平性问题，尤其是在复杂的不公平场景下，提出了一种统一的框架来处理不同的情况和公平标准，并介绍了一种学习公平表示的方法和一种考虑敏感属性使用限制的技术。

Dec, 2020

公平和偏见的逻辑理论

本文主要论述机器学习中公平性问题，提出三种公平模型：无意识公平、人口统计学公平和反事实公平，并在认识情境演算中进行了形式化的定义。

Jun, 2023

公平性的测度和误测：公平机器学习的关键综述

公平机器学习的早期专注是确保由算法指导的决策是公平的，三个公平定义引起了人们的关注，即反分类，分类平衡和校准，但这三个公平定义都有重大的统计局限性。相比之下，我们认为更倾向于根据最准确的风险估计对类似风险的人进行相似的处理，而不是一定要满足公平的数学定义，并强调这种方法需要大量的努力来构建适当的风险估计。

Jul, 2018

基于不确定性的公平度量

通过引入基于不同类型的不确定性，即不确定性度量和主观不确定性度量，证明了不确定性度量在公平性评估中的补充作用，并提供了关于导致偏见的潜在问题的更多见解。

Dec, 2023

算法公平性隐私风险

研究算法公平性和隐私在机器学习中的应用，分析了公平性对训练数据信息泄露的影响，发现公平性会牺牲一部分隐私权，特别是对弱势群体。同时，训练数据的偏差越大，为了弱势群体的公平性所付出的隐私成本也越高。

Nov, 2020