分析虚假训练数据对深度学习系统性能的影响

Mar, 2023

分析虚假训练数据对深度学习系统性能的影响

Analyzing Effects of Fake Training Data on the Performance of Deep Learning Systems

Pratinav Seth, Akshat Bhandari, Kumud Lakara

TL;DR本文深入分析了使用不同比例的真实数据和合成数据来训练计算机视觉模型对模型鲁棒性和预测质量的影响，证明使用生成对抗网络生成高质量合成数据可以减轻深度学习模型面临的挑战。

Abstract

deep learning models frequently suffer from various problems such as class imbalance and lack of robustness to distribution shift. It is often difficult to find data suitable for training beyond the available benchmarks. This is especially the case for →

deep learning generative adversarial networks synthetic data computer vision model training

发现论文，激发创造

分析合成和真实数据对物体检测性能的影响：我们实际需要多少真实数据？

本文探讨使用合成数据来代替真实数据训练深度网络的效果，分析有限真实数据的影响，使用模拟工具创建大量廉价注释合成数据，并提供设计方法论程序的见解。

Jul, 2019

真假：通过分布匹配进行有效的训练数据合成

我们通过广泛的实验验证了我们的合成数据在各种图像分类任务中的有效性，既可以替代真实数据集，也可以作为其增强，同时也有益于挑战性任务，如超出分布的泛化和隐私保护。

Oct, 2023

提高机器学习合成数据的逼真度研究

本研究着眼于深入评估和比较对于机器学习的通用合成数据的对抗训练效果，并旨在使用未标记的真实数据条件下的合成 - 真实生成模型将合成图像转化为更真实的风格，并通过定性和定量指标进行广泛的性能评估和比较。

Apr, 2023

深度学习的合成数据

本研究展示了合成数据的各种发展和应用方向，其中讨论合成数据的基本计算机视觉问题、室内外场景合成及数据应用、机器人仿真环境、合成数据在隐私相关应用方面的重要性，同时概括了如何改进和生产合成数据的替代方法。其次，介绍了合成数据转化后的真实应用存在的问题，最后，着重强调了未来在合成数据研究方面的最有潜力的方向。

Sep, 2019

使用合成数据增广消除数据集偏差

本文探讨使用有针对性的合成数据增强 - 结合游戏引擎模拟和 sim2real 风格转移技术 - 填补视觉任务的真实数据集中的空缺。在三种不同的计算机视觉任务中（停车位检测，车道检测和单 ocular 深度估计），实证研究一致表明，将合成数据与真实数据混合训练能够显著提高交叉数据集的泛化性能。

Apr, 2020

计算机视觉中合成数据增强方法的调查

这篇论文对合成数据增强技术进行了广泛评估，包括基于真实 3D 图形建模、神经风格迁移、差分神经渲染、生成对抗网络和变分自编码器等生成人工智能技术。对于每一种方法类别，我们关注重要的数据生成和增强技术、广泛的应用范围和具体的用例，以及现有限制和可能的解决方法。此外，我们总结了用于训练计算机视觉模型的常见合成数据集，强调主要特点、应用领域和支持的任务。最后，我们讨论了合成数据增强方法的有效性，并希望通过这篇详细的论文为读者提供必要的背景信息和深入了解现有方法及相关问题。

Mar, 2024

利用合成训练数据提高深度学习质量检测的泛化能力

通过生成合成图像来解决领域不稳定性问题，从而使训练的深度学习模型更加稳健。我们描述了我们的合成数据生成管道和我们的深度学习方法来回答这些问题。

Feb, 2022

提高深度生成数据的效果

即使合成图像在下游图像分类任务中导致性能下降，通过使用合成图像增强真实数据可以在数据稀缺情况下提升下游分类任务的表现，内容差距是这一现象的较大部分原因，我们提出了策略来更好地利用深度生成模型中的合成图像。

Nov, 2023

生成逼真的训练数据以提高人脸识别准确性

本文研究使用合成数据来增强面部数据集的可行性。我们提出了一种新颖的生成对抗网络（GAN），可以将相关身份属性与非相关身份属性区分开来。我们的 GAN 能够生成数据增强的合成图像，并且该模型可以提高面部识别模型的准确率。

Oct, 2018

使用合成数据训练深度人脸识别系统

本研究使用 3D 可变形面部模型，通过合成数据生成具有不同面部身份和完全控制的姿态、光照和背景的图像，观察到利用合成数据可以显著降低对真实世界图像需求，在预训练后，通过微调真实图像，合成数据与真实数据相结合的模型可获得更高的性能，而且并没有负面影响。

Feb, 2018