合成数据作为验证
本研究展示了合成数据的各种发展和应用方向,其中讨论合成数据的基本计算机视觉问题、室内外场景合成及数据应用、机器人仿真环境、合成数据在隐私相关应用方面的重要性,同时概括了如何改进和生产合成数据的替代方法。其次,介绍了合成数据转化后的真实应用存在的问题,最后,着重强调了未来在合成数据研究方面的最有潜力的方向。
Sep, 2019
通过使用生成模型中的合成训练数据,本研究提出了一个全面框架,以提高医学图像分析的模型开发效果,同时解决数据稀缺、数据不平衡和患者隐私问题。通过在各种规模的数据集上进行测试,我们展示了生成模型作为数据增广方法的优势,以及通过敌对方法保护患者隐私以及使用实际留存数据进行模型测试的新型性能指标。我们证明了使用合成数据和真实数据进行训练优于仅使用真实数据进行训练,并且仅使用合成数据进行训练的模型接近仅使用真实数据进行训练的模型。
Oct, 2023
本文研究了航拍人体检测中利用合成数据来训练的方法,通过探讨实际数据、合成数据和数据池选择对合成数据的质量影响以及利用合成数据提高学习性能和域泛化能力的效果,发现了几个重要的发现,为未来研究提供了更合理的使用合成数据的方向。
May, 2024
本文介绍了数据中心化思维的重要性和隐私问题、提出了基于合成数据的解决方案,并开发了一种全面的测试方法(DAISYnt),以检验这种方法在高度监管的领域中的可行性和质量,例如金融和医疗保健。
Apr, 2022
利用潜在扩散模型生成皮肤病图像的研究表明,通过合成数据训练模型可以在数据有限的情况下提高性能,但合成数据与真实数据相比仍然有较小的性能增益,因此收集多样的真实数据仍是提升医疗人工智能算法的重要步骤。
Aug, 2023
本文探讨使用有针对性的合成数据增强 - 结合游戏引擎模拟和 sim2real 风格转移技术 - 填补视觉任务的真实数据集中的空缺。在三种不同的计算机视觉任务中(停车位检测,车道检测和单 ocular 深度估计),实证研究一致表明,将合成数据与真实数据混合训练能够显著提高交叉数据集的泛化性能。
Apr, 2020
本文挑战了最先进的生成模型,通过对稳定扩散进行微调,在语义分割方面自动生成合成数据以评估其可靠性。通过广泛实验,我们表明合成数据与真实异常数据的表现之间存在高度相关性,从而显示了该方法的有效性。此外,我们说明了如何利用合成数据来提高分割器的校准和异常检测能力。
Dec, 2023
使用扩散模型的合成数据补充对胸部 X 射线影像(CXR)分析中深度学习(DL)分类器性能的影响进行了研究,评估了内部和外部数据集上分类器的性能,结果表明合成数据补充可以增强模型准确性,尤其是在检测罕见病变方面。然而,尽管结果有希望,真实数据的优越性仍然存在。
Nov, 2023