本研究使用 3D 可变形面部模型,通过合成数据生成具有不同面部身份和完全控制的姿态、光照和背景的图像,观察到利用合成数据可以显著降低对真实世界图像需求,在预训练后,通过微调真实图像,合成数据与真实数据相结合的模型可获得更高的性能,而且并没有负面影响。
Feb, 2018
本文介绍了使用合成人脸图像的方法解决现实世界人脸识别中困难的问题,并提出了SynFace,探讨了训练人工合成和真实图像的最新人脸识别模型之间的性能差距及其原因,并提出了identity mixup和domain mixup方法来缓解性能差距。此外,对于人工合成的图像,本文还对姿态,表情,光照等因素进行了实验分析,提供了几种有效利用合成数据进行人脸识别的方法。
Aug, 2021
本研究提出并研究了使用一种隐私友好的合成人脸数据集,通过条件生成对抗网络生成类标记的人脸图像。在此基础上,提出了三种不同的学习策略,对这种隐私友好的合成数据集进行人脸识别的训练,并在多个人脸识别基准测试中证明了其高潜力。
Jun, 2022
该研究论文探讨了合成面部数据在人脸识别领域中的应用及近期进展,以及由此带来的挑战和未来前景。研究提出合成数据作为隐私友好的替代品具有很大的潜力。
May, 2023
本研究利用合成数据和微调模型,在人脸识别领域取得了高精确度的成果,并研究表明模型的性能还受到脸部不同部位的影响。
合成数据在解决处理真实面部数据的伦理和法律挑战中作为真实数据的替代品出现。我们研究了合成面部识别数据集的多样性与真实数据集的对比,以及生成模型的训练数据分布如何影响合成数据的分布。我们还研究了在比较最近三个基于合成数据的面部识别模型与基准模型(基于真实数据)在所研究属性上的具体偏差。结果显示,生成器生成的不同属性具有与所使用的训练数据相似的分布。在偏差方面,合成模型与真实模型具有类似的偏差行为。然而,发现较低的内部一致性似乎有助于减少偏差。
Nov, 2023
本研究主要探讨利用合成人脸数据训练深度人脸识别模型的有效性,以减少对真实图像的依赖并解决数据收集问题,并且通过数据增强技术的应用进一步优化识别准确率。
Apr, 2024
通过对真实数据集和合成数据集进行性能比较,我们发现了真实数据集和合成数据集之间的差异,并发现真实样本足以解释合成分布,而相反情况则不成立。
使用合成数据的机器学习系统存在两个主要风险:通过增加数据集的多样性和代表性,使用合成数据会导致虚假信心的高风险;同时,使用合成数据还会规避数据使用授权,对现有的治理和道德实践产生复杂影响,将数据与受影响个体分离开,可能使算法引发的伤害权力进一步集中。
May, 2024
本研究针对扩散模型在生成合成图像过程中的个人数据,特别是面部图像的未授权使用问题,提出了一种新的身份推断框架。该框架超越了传统的成员推断攻击,从身份层面对数据隐私侵犯进行了深入探讨,实验结果表明,其攻击成功率高达89%,并在不同模型上取得了显著的有效性验证。
Oct, 2024