在公平表示和准确性之间填补差距

Apr, 2024

在公平表示和准确性之间填补差距

Closing the Gap in the Trade-off between Fair Representations and Accuracy

Biswajit Rout, Ananya B. Sai, Arun Rajkumar

TL;DR通过分析文档和句子的自然语言表示（即编码），我们发现并研究了这些编码中可能存在的针对不同子群体的偏见，并提出了缓解这种偏见的方法同时保持分类模型的较高准确性。

Abstract

The rapid developments of various machine learning models and their deployments in several applications has led to discussions around the importance of looking beyond the accuracies of these models. fairness of s

machine learning models fairness natural language representations embedding-level bias classification models

发现论文，激发创造

机器学习中的公平性

讨论如何使用因果贝叶斯网络和最优输运理论来处理机器学习公平性问题，尤其是在复杂的不公平场景下，提出了一种统一的框架来处理不同的情况和公平标准，并介绍了一种学习公平表示的方法和一种考虑敏感属性使用限制的技术。

Dec, 2020

对抗式叠加自编码器用于公平表示学习

本研究提出了一种基于不同层级的数据表征的公平表征学习方法，通过堆叠不同的自编码器在不同的潜在空间强制执行公平性，更好地满足公平度量标准并提高数据表征的公平性。

Jul, 2021

自然语言处理中偏差和公平性调查

本次调查分析了 NLP 模型的社会影响，探讨了 NLP 算法中存在性别、种族和文化偏见的根源，定义了公平性，并说明了 NLP 各个子领域如何减少系统存在的偏见，最终讨论了未来研究如何消除 NLP 算法中的有害偏见。

Mar, 2022

足够公平：在自然语言处理领域规范评估和选择公平性研究的模型

本研究就 NLP 系统展示的偏见和模型去偏见技术的限制做了梳理和评价，提出了实现公平学习的建议，具体包括明确不同方法之间的关系和与公平性理论的关系，以及处理模型选择问题的声明性工具，以帮助未来的工作。

Feb, 2023

机器学习中的公平性：一项调查

这篇文章介绍了机器学习中的社会偏见和公平性问题，总结了预处理、处理和后处理等多种方法，包含二分类、回归、推荐系统、无监督学习和自然语言处理等多个方面，同时提供了多个开源库。最后，列举了公平性研究的四个难题。

Oct, 2020

视觉和语言研究中实现更公平的神经模型的去偏置方法：一份调查报告

在电脑视觉和自然语言处理领域中，神经网络虽然能够取得最新成果，但是其存在数据内的建模偏见，导致人工智能领域出现了公平性的研究方向，其目的为了纠正算法偏见，提出了几种基于公平性的神经网络去偏置的方法。

Nov, 2022

有条件的公平表达学习

本篇研究旨在提出一种新算法，用于学习公平的表征，以在分类环境下同时缓解不同人口统计特征子组之间的两种不平等概念。通过平衡误差率和条件对齐的表征等两个关键组件，它对确保跨组别的准确平等性和平衡假阳性和假阴性率发挥了作用。此外，我们还通过理论和两个实际实验证明，与现有的学习公平表征的算法相比，在平衡数据集上提出的算法可以在保持效用公平性的前提下得到更好的公平性。

Oct, 2019

一个众包平台上的机器学习模型是否会表现出偏见？模型公正性的实证研究

本文展示了在真实世界中基于 40 个高评分 Kaggle 模型的公平性评估及其 7 种缓解技术的实证研究。结果发现，部分优化技术会导致模型失公，尽管机器学习库中有公平控制机制，但这些机制未被记录。最佳的降低失公的方法往往存在权衡和代价.

May, 2020

语言建模中公平与隐私之间的权衡

本研究探讨在训练文本生成模型时如何同时兼顾隐私保护和去除社交偏见的问题，经实验证明，保护隐私的同时也会使分类任务中的偏见加剧，为了在双方兼顾的情况下提高模型的效用，在损失一些隐私保护的基础上，通过去偏增强模型可以达到最优化。

May, 2023

训练公平神经网络的技术挑战

机器学习算法已被广泛应用在各种领域，然而由此带来的公平性问题在高风险案例（如人脸识别和医学影像分析）中引起了极大关注。本文针对深度神经网络中公平性的限制条件及其行为矫正方法的有效性进行了研究，实验结果表明，在特定公平度量下，大型模型会对公平的过度拟合而产生一系列意外和不良后果。

Feb, 2021