关于 GAN 在人脸验证中的偏差行为

ECCVAug, 2022

关于 GAN 在人脸验证中的偏差行为

On Biased Behavior of GANs for Face Verification

Sasikanth Kotti, Mayank Vatsa, Richa Singh

TL;DR本文介绍了深度学习系统需要大量数据进行训练的主题，提出了使用生成模型（如 GAN）生成合成数据的替代方法。然而，我们证明使用 GAN 生成的数据容易存在偏见和公平性问题，尤其是针对年龄段在 20-29 岁之间的白人脸部图像生成存在偏见。此外，我们还证明了在微调人脸验证系统时，合成人脸会对种族属性造成不公平影响。

Abstract

deep learning systems need large data for training. Datasets for training face verification systems are difficult to obtain and prone to privacy issues. →

deep learning face verification systems synthetic data gans bias and fairness issues

发现论文，激发创造

合成基于人脸识别中的偏见和多样性

合成数据在解决处理真实面部数据的伦理和法律挑战中作为真实数据的替代品出现。我们研究了合成面部识别数据集的多样性与真实数据集的对比，以及生成模型的训练数据分布如何影响合成数据的分布。我们还研究了在比较最近三个基于合成数据的面部识别模型与基准模型 (基于真实数据) 在所研究属性上的具体偏差。结果显示，生成器生成的不同属性具有与所使用的训练数据相似的分布。在偏差方面，合成模型与真实模型具有类似的偏差行为。然而，发现较低的内部一致性似乎有助于减少偏差。

Nov, 2023

利用已有的偏置 StyleGAN2 进行零样本平衡种族数据集生成

该论文提出利用深层学习方式进行人脸识别，通过生成对抗网络 GAN 生成虚拟多样的人脸数据集，以减小数据集的偏差对模型预测性能的影响。

May, 2023

Imperfect ImaGANation: GAN 加重偏见，对面部数据增强和 Snapchat 自拍镜头的影响

本研究表明，基于 Generative Adversarial Networks（GANs）的数据增强方法在数据集存在偏向性的情况下，可能会加剧性别和肤色偏见等潜在维度的偏向。特别地，我们展示了 GANs 进一步扭曲了由工程师头像组成的数据集的分布，会对少数族裔造成负面影响。因此，本研究是一种警示性的学术探究。

Jan, 2020

迈向更公平的人脸识别数据集

利用生成的训练数据集中的人口属性平衡机制，提出了一种全面的评估方法，旨在促进更公平、透明的人脸识别和验证，并发现在减少人口属性不公平的同时，性能差距仍然存在。

Jun, 2024

生成逼真的训练数据以提高人脸识别准确性

本文研究使用合成数据来增强面部数据集的可行性。我们提出了一种新颖的生成对抗网络（GAN），可以将相关身份属性与非相关身份属性区分开来。我们的 GAN 能够生成数据增强的合成图像，并且该模型可以提高面部识别模型的准确率。

Oct, 2018

GANDiffFace: 通过对真实变异性的控制生成可控的人脸识别合成数据集

本论文提出了 GANDiffFace，一种结合生成对抗网络（GAN）和扩散模型的新型框架，用于为人脸识别生成具有高度真实感的合成数据集，以克服现有合成数据集的局限性，特别是 GAN 提供的有限化内类别变化，进而增强内类别变化。

May, 2023

缓解人脸合成方法中的偏差的抽样策略

通过对 Flickr Faces HQ 数据集上训练的 StyleGAN2 生成模型进行分析，本文提出了两种采样策略来平衡生成的人脸图像中选择属性的表示，并揭示了针对非常年轻和非常年老年龄组以及女性面孔的随机采样图像分布中出现的偏差。通过在潜在空间上选择特定的线或球来增加来自欠代表类的生成样本数量，以减轻偏差，并在不同质量级别上呈现出受保护特征的更均匀分布。

May, 2024

分析虚假训练数据对深度学习系统性能的影响

本文深入分析了使用不同比例的真实数据和合成数据来训练计算机视觉模型对模型鲁棒性和预测质量的影响，证明使用生成对抗网络生成高质量合成数据可以减轻深度学习模型面临的挑战。

Mar, 2023

不需重新训练深度生成模型的公平性改进

该研究使用生成对抗网络 (GANs) 生成面孔，发现在生成图像的过程中，训练数据中的偏见被放大。为了解决这个问题，提出了一种可解释的基准方法来平衡产生的面部属性，从而产生更平衡的数据。同时，该方法具有泛化能力来处理多个属性以及细分组的样本合成，进而用于量化商业人脸属性分类器和人脸超分辨率算法中的偏见。

Dec, 2020

使用合成脸部数据进行人脸识别

本研究利用合成数据和微调模型，在人脸识别领域取得了高精确度的成果，并研究表明模型的性能还受到脸部不同部位的影响。

May, 2023