分析虚假训练数据对深度学习系统性能的影响
本文探讨使用合成数据来代替真实数据训练深度网络的效果,分析有限真实数据的影响,使用模拟工具创建大量廉价注释合成数据,并提供设计方法论程序的见解。
Jul, 2019
我们通过广泛的实验验证了我们的合成数据在各种图像分类任务中的有效性,既可以替代真实数据集,也可以作为其增强,同时也有益于挑战性任务,如超出分布的泛化和隐私保护。
Oct, 2023
本研究着眼于深入评估和比较对于机器学习的通用合成数据的对抗训练效果,并旨在使用未标记的真实数据条件下的合成 - 真实生成模型将合成图像转化为更真实的风格,并通过定性和定量指标进行广泛的性能评估和比较。
Apr, 2023
本研究展示了合成数据的各种发展和应用方向,其中讨论合成数据的基本计算机视觉问题、室内外场景合成及数据应用、机器人仿真环境、合成数据在隐私相关应用方面的重要性,同时概括了如何改进和生产合成数据的替代方法。其次,介绍了合成数据转化后的真实应用存在的问题,最后,着重强调了未来在合成数据研究方面的最有潜力的方向。
Sep, 2019
本文探讨使用有针对性的合成数据增强 - 结合游戏引擎模拟和 sim2real 风格转移技术 - 填补视觉任务的真实数据集中的空缺。在三种不同的计算机视觉任务中(停车位检测,车道检测和单 ocular 深度估计),实证研究一致表明,将合成数据与真实数据混合训练能够显著提高交叉数据集的泛化性能。
Apr, 2020
这篇论文对合成数据增强技术进行了广泛评估,包括基于真实 3D 图形建模、神经风格迁移、差分神经渲染、生成对抗网络和变分自编码器等生成人工智能技术。对于每一种方法类别,我们关注重要的数据生成和增强技术、广泛的应用范围和具体的用例,以及现有限制和可能的解决方法。此外,我们总结了用于训练计算机视觉模型的常见合成数据集,强调主要特点、应用领域和支持的任务。最后,我们讨论了合成数据增强方法的有效性,并希望通过这篇详细的论文为读者提供必要的背景信息和深入了解现有方法及相关问题。
Mar, 2024
通过生成合成图像来解决领域不稳定性问题,从而使训练的深度学习模型更加稳健。我们描述了我们的合成数据生成管道和我们的深度学习方法来回答这些问题。
Feb, 2022
即使合成图像在下游图像分类任务中导致性能下降,通过使用合成图像增强真实数据可以在数据稀缺情况下提升下游分类任务的表现,内容差距是这一现象的较大部分原因,我们提出了策略来更好地利用深度生成模型中的合成图像。
Nov, 2023
本文研究使用合成数据来增强面部数据集的可行性。我们提出了一种新颖的生成对抗网络(GAN),可以将相关身份属性与非相关身份属性区分开来。我们的 GAN 能够生成数据增强的合成图像,并且该模型可以提高面部识别模型的准确率。
Oct, 2018
本研究使用 3D 可变形面部模型,通过合成数据生成具有不同面部身份和完全控制的姿态、光照和背景的图像,观察到利用合成数据可以显著降低对真实世界图像需求,在预训练后,通过微调真实图像,合成数据与真实数据相结合的模型可获得更高的性能,而且并没有负面影响。
Feb, 2018