提高机器学习合成数据的逼真度研究
本文深入分析了使用不同比例的真实数据和合成数据来训练计算机视觉模型对模型鲁棒性和预测质量的影响,证明使用生成对抗网络生成高质量合成数据可以减轻深度学习模型面临的挑战。
Mar, 2023
本文研究使用合成数据来增强面部数据集的可行性。我们提出了一种新颖的生成对抗网络(GAN),可以将相关身份属性与非相关身份属性区分开来。我们的 GAN 能够生成数据增强的合成图像,并且该模型可以提高面部识别模型的准确率。
Oct, 2018
我们通过广泛的实验验证了我们的合成数据在各种图像分类任务中的有效性,既可以替代真实数据集,也可以作为其增强,同时也有益于挑战性任务,如超出分布的泛化和隐私保护。
Oct, 2023
本研究使用 CARLA 模拟器生成综合数据集,使其具有逼真的对抗性示例攻击,并使用处理和转换效果与真实世界图像相同的模拟攻击来说明其与现实的相关性。
Jul, 2022
即使合成图像在下游图像分类任务中导致性能下降,通过使用合成图像增强真实数据可以在数据稀缺情况下提升下游分类任务的表现,内容差距是这一现象的较大部分原因,我们提出了策略来更好地利用深度生成模型中的合成图像。
Nov, 2023
本文提出了一种基于对比的从合成到真实的泛化(Contrastive Synthetic-to-Real Generalization, CSG)框架,该框架利用预训练的 ImageNet 知识防止过度拟合合成域,同时提高特征嵌入的多样性以改善泛化性能,还使用注意力池化(A-pool)来进一步提高泛化性能。研究结果表明,此方法在各种合成训练任务中展示了最新的零 - shot 域泛化性能。
Apr, 2021
本文探讨了在不同概念类之间泛化的挑战,并提出了一种基于质量评估模型的质量抽样方法,通过 StyleGAN2 和 Latent Diffusion 生成的图像进行实验,结果表明采用本文提出的方法可以提高合成图像检测器的检测性能。
Apr, 2023
通过三种不同的生成式人工智能方法应用驾驶模拟器中的语义标签图作为创建真实数据集的桥梁,本文比较分析了这些方法的图像质量和感知能力,产生了包括驾驶图像和自动生成的高质量注释的新合成数据集,证明了扩散式方法可以提供改进的稳定性和解决 Sim2Real 挑战的替代方法。
Apr, 2024