DSAP：通过数据集的人口统计比较分析偏见

Dec, 2023

DSAP：通过数据集的人口统计比较分析偏见

DSAP: Analyzing Bias Through Demographic Comparison of Datasets

Iris Dominguez-Catena, Daniel Paternain, Mikel Galar

TL;DR提出了 DSAP（Demographic Similarity from Auxiliary Profiles）方法，用于比较和量化数据集中的人口构成，可应用于检测和表征数据集中的人口盲点和偏见问题、测量单个数据集中的人口偏见以及测量部署场景中的数据集人口变化。

Abstract

In the last few years, artificial intelligence systems have become increasingly widespread. Unfortunately, these systems can share many biases with human decision-making, including demographic →

artificial intelligence systems biases datasets dsap demographic bias

发现论文，激发创造

人口平等：缓解现实世界数据中的偏见

计算机决策系统在许多日常生活的方面得到广泛应用，但其中可能存在性别、种族或其他偏见问题。本研究提出一种鲁棒的方法，通过真实世界数据提取出表征人口平衡和真实性的数据集，用于训练分类器，并测试其泛化能力，证实计算机辅助决策中不存在明示或隐含偏见。

Sep, 2023

评估基于数据集到模型的人口统计偏差转移：以面部表情识别为例的案例研究

本研究提出了一种新的度量方法，用于评估多类多人口统计分类问题中面部表情识别中的代表性和刻板印象偏见以及训练模型的残余偏见。这些度量结合在一起，可以用于研究和比较不同的偏见缓解方法。在对 Affectnet 数据集进行分析后，我们发现其中存在巨大的种族偏见和性别定型，并提供了不同人口统计属性的不同子集来训练模型。

May, 2022

探究深度面部分析中的偏差：KANFace 数据集和实证研究

本文研究基于深度学习技术的面部识别、年龄估计、性别识别和亲属关系验证模型中存在的人口统计学偏差，并通过引入规模最大、最全面的面部图像和视频数据集及手动注释，揭示了基于最先进模型的拟合性能和偏差，最后引入和验证了去偏嵌入网络的方法。

May, 2020

利用原型表示消除社会偏见而不包含人口统计信息

DAFair 是一种用于减轻语言模型中社会偏见的新方法，通过预定义的典型人口统计文本，并在微调过程中加入正则化项来纠正模型的表示中的偏见，从而在两个任务和两个模型上实证结果显示了我们方法的有效性。此外，即使在有限的人口统计注释数据下，我们的方法也优于常见的去偏方法。

Mar, 2024

Sonos 语音控制偏倚评估数据集：语音助手中人口统计偏倚评估的方法论

该研究引入了 Sonos Voice Control Bias Assessment Dataset，一个包含控制人口统计学标签的大型数据集，通过针对音乐领域的语音助手请求（1,038 名说话者，166 小时，170k 音频样本，9,040 个唯一标记的转录文本）进行了控制人口统计多样性（性别、年龄、方言区域和种族）。研究还提出了一种统计的人口统计偏见评估方法，适用于这种特定的用例，并利用口语理解度量标准而非转录准确性，我们认为后者更能代表用户体验。通过考虑一对最先进的自动语音识别和口语理解模型，展示了该数据集和统计方法检测人口统计偏见的能力。结果表明在年龄、方言区域和种族之间性能存在统计上显著差异。多变量测试对于阐明方言区域、性别和年龄之间的混合效应至关重要。

May, 2024

朝着负责任的人脸数据集：对解缠的潜空间建模以从人口群体中采样人脸图像

该研究论文探讨了一种根据样式生成对抗网络（StyleGAN）潜在空间的简单方法，用于生成平衡且可能无偏差的合成数据集，以用于训练、规范化或评估基于深度学习的人脸识别模型，并证明了可以有效地合成任何组合的人口统计学群体。

Sep, 2023

利用模拟来识别人工智能中的偏见

通过高保真计算机模拟和贝叶斯参数搜索，诊断机器学习模型中的偏倚问题，特别是面部识别商业 API 中的人口统计学偏见。

Sep, 2018

SDFD: 构建具有多样属性的通用合成人脸图像数据集

通过提出一种生成综合面部多样性数据集的方法，本研究旨在解决现有面部图像数据集集中在年龄、性别和肤色等少数面部属性上的问题，从而提高 AI 系统的鲁棒性。这种方法不仅包括人口统计学和生物识别特征，还涵盖了妆容、发型和配饰等非永久性特征，通过引导最先进的文本到图像模型生成高质量、逼真的综合数据集，并可用于面部分析系统的评估。与现有数据集相比，我们提出的数据集在图像分类任务中同样具有或更高的挑战性，同时大小更小。

Apr, 2024

人脸识别中减少人口统计偏见的合成数据

通过使用合成数据来缓解影响面部识别技术的人口偏见的可能性进行了研究。

Feb, 2024

DispaRisk: 数据集中不平等风险的评估和解释

介绍 DispaRisk，这是一种新颖的框架，旨在在 ML 流程的初期阶段，主动评估数据集中差异的潜在风险。通过与公平研究中常用的数据集进行基准测试，我们发现 DispaRisk 能够识别具有高歧视风险、易受偏见影响的模型家族以及增加 ML 流程中歧视敏感性的特征。

May, 2024