关于 GAN 在人脸验证中的偏差行为
合成数据在解决处理真实面部数据的伦理和法律挑战中作为真实数据的替代品出现。我们研究了合成面部识别数据集的多样性与真实数据集的对比,以及生成模型的训练数据分布如何影响合成数据的分布。我们还研究了在比较最近三个基于合成数据的面部识别模型与基准模型 (基于真实数据) 在所研究属性上的具体偏差。结果显示,生成器生成的不同属性具有与所使用的训练数据相似的分布。在偏差方面,合成模型与真实模型具有类似的偏差行为。然而,发现较低的内部一致性似乎有助于减少偏差。
Nov, 2023
该论文提出利用深层学习方式进行人脸识别,通过生成对抗网络 GAN 生成虚拟多样的人脸数据集,以减小数据集的偏差对模型预测性能的影响。
May, 2023
本研究表明,基于 Generative Adversarial Networks(GANs)的数据增强方法在数据集存在偏向性的情况下,可能会加剧性别和肤色偏见等潜在维度的偏向。特别地,我们展示了 GANs 进一步扭曲了由工程师头像组成的数据集的分布,会对少数族裔造成负面影响。因此,本研究是一种警示性的学术探究。
Jan, 2020
利用生成的训练数据集中的人口属性平衡机制,提出了一种全面的评估方法,旨在促进更公平、透明的人脸识别和验证,并发现在减少人口属性不公平的同时,性能差距仍然存在。
Jun, 2024
本文研究使用合成数据来增强面部数据集的可行性。我们提出了一种新颖的生成对抗网络(GAN),可以将相关身份属性与非相关身份属性区分开来。我们的 GAN 能够生成数据增强的合成图像,并且该模型可以提高面部识别模型的准确率。
Oct, 2018
本论文提出了 GANDiffFace,一种结合生成对抗网络(GAN)和扩散模型的新型框架,用于为人脸识别生成具有高度真实感的合成数据集,以克服现有合成数据集的局限性,特别是 GAN 提供的有限化内类别变化,进而增强内类别变化。
May, 2023
通过对 Flickr Faces HQ 数据集上训练的 StyleGAN2 生成模型进行分析,本文提出了两种采样策略来平衡生成的人脸图像中选择属性的表示,并揭示了针对非常年轻和非常年老年龄组以及女性面孔的随机采样图像分布中出现的偏差。通过在潜在空间上选择特定的线或球来增加来自欠代表类的生成样本数量,以减轻偏差,并在不同质量级别上呈现出受保护特征的更均匀分布。
May, 2024
本文深入分析了使用不同比例的真实数据和合成数据来训练计算机视觉模型对模型鲁棒性和预测质量的影响,证明使用生成对抗网络生成高质量合成数据可以减轻深度学习模型面临的挑战。
Mar, 2023
该研究使用生成对抗网络 (GANs) 生成面孔,发现在生成图像的过程中,训练数据中的偏见被放大。为了解决这个问题,提出了一种可解释的基准方法来平衡产生的面部属性,从而产生更平衡的数据。同时,该方法具有泛化能力来处理多个属性以及细分组的样本合成,进而用于量化商业人脸属性分类器和人脸超分辨率算法中的偏见。
Dec, 2020