本研究利用合成数据和微调模型,在人脸识别领域取得了高精确度的成果,并研究表明模型的性能还受到脸部不同部位的影响。
May, 2023
本研究主要探讨利用合成人脸数据训练深度人脸识别模型的有效性,以减少对真实图像的依赖并解决数据收集问题,并且通过数据增强技术的应用进一步优化识别准确率。
Apr, 2024
本研究使用 3D 可变形面部模型,通过合成数据生成具有不同面部身份和完全控制的姿态、光照和背景的图像,观察到利用合成数据可以显著降低对真实世界图像需求,在预训练后,通过微调真实图像,合成数据与真实数据相结合的模型可获得更高的性能,而且并没有负面影响。
Feb, 2018
合成数据在解决处理真实面部数据的伦理和法律挑战中作为真实数据的替代品出现。我们研究了合成面部识别数据集的多样性与真实数据集的对比,以及生成模型的训练数据分布如何影响合成数据的分布。我们还研究了在比较最近三个基于合成数据的面部识别模型与基准模型 (基于真实数据) 在所研究属性上的具体偏差。结果显示,生成器生成的不同属性具有与所使用的训练数据相似的分布。在偏差方面,合成模型与真实模型具有类似的偏差行为。然而,发现较低的内部一致性似乎有助于减少偏差。
Nov, 2023
本文介绍了使用合成人脸图像的方法解决现实世界人脸识别中困难的问题,并提出了 SynFace,探讨了训练人工合成和真实图像的最新人脸识别模型之间的性能差距及其原因,并提出了 identity mixup 和 domain mixup 方法来缓解性能差距。此外,对于人工合成的图像,本文还对姿态,表情,光照等因素进行了实验分析,提供了几种有效利用合成数据进行人脸识别的方法。
Aug, 2021
本研究提出并研究了使用一种隐私友好的合成人脸数据集,通过条件生成对抗网络生成类标记的人脸图像。在此基础上,提出了三种不同的学习策略,对这种隐私友好的合成数据集进行人脸识别的训练,并在多个人脸识别基准测试中证明了其高潜力。
Jun, 2022
通过使用合成数据来缓解影响面部识别技术的人口偏见的可能性进行了研究。
Feb, 2024
使用合成数据的机器学习系统存在两个主要风险:通过增加数据集的多样性和代表性,使用合成数据会导致虚假信心的高风险;同时,使用合成数据还会规避数据使用授权,对现有的治理和道德实践产生复杂影响,将数据与受影响个体分离开,可能使算法引发的伤害权力进一步集中。
May, 2024
通过对真实数据集和合成数据集进行性能比较,我们发现了真实数据集和合成数据集之间的差异,并发现真实样本足以解释合成分布,而相反情况则不成立。
在快速发展的人工智能领域中,合成数据集的创建和利用日益重要。此报告重点探讨了合成数据的多方面特点,尤其强调了这些数据集可能存在的挑战和潜在偏见。它探讨了合成数据生成的方法,涉及传统统计模型到先进深度学习技术,并研究了它们在不同领域的应用。此报告还批判性地讨论合成数据集涉及的道德考虑和法律影响,突出了确保公平性、减轻偏见和维护人工智能发展中的道德标准的机制的紧迫性。
Jan, 2024