合成数据在重新识别中的应用性
本研究旨在评估使用游戏引擎在托盘分割的机器学习中生成合成训练数据的可行性。研究开发了一款工具,可从 3D 模型以像素完美的准确性自动生成大量带注释的训练数据,并且比手动方法更快地进行。使用 Mask R-CNN 管道进行图像分割,对于单独的托盘,AP50 达到了 86%。
Apr, 2023
本文研究使用合成数据来增强面部数据集的可行性。我们提出了一种新颖的生成对抗网络(GAN),可以将相关身份属性与非相关身份属性区分开来。我们的 GAN 能够生成数据增强的合成图像,并且该模型可以提高面部识别模型的准确率。
Oct, 2018
使用合成数据在机器学习中能够节省大量时间,本研究旨在改进先前实施的方法,以实现仓库环境中托盘的实例分割。通过使用合成生成的域随机数据和通过 Unity 生成的数据,该研究在真实数据评估中对叠放和垛放托盘类别分别实现了 69% 和 50% mAP50 的性能提升。此外,在光线较暗的环境下评估模型时,其性能有显著影响,当在亮度降低 80% 的图像上进行评估时,mAP50 降至 3% 左右。此研究还创建了一个使用 YOLOv8 和 SAM 的两阶段检测器,但其性能不稳定。与 Unity 生成数据相比,使用域随机数据的性能改进可忽略。
Feb, 2024
使用生成对抗网络 (GAN) 以解决真实与合成数据之间的领域差异,提高物体检测的性能,尤其针对行人检测,在不需要真实标签的情况下生成真实样本,适用于各种下游任务。
Jul, 2023
本文研究应用生成对抗网络(GANs)生成真实且无隐私顾虑的电信号数据,用于医疗培训和数据分析,并就 GANs 产生的合成数据的隐私问题进行讨论。研究结果表明 GANs 的架构成功地生成了与训练集相似且不同样本的时间序列信号,并且能够经受住简单的成员推断攻击,保证了训练集的隐私。
Sep, 2019
我们研究了生成对抗网络(GANs)用于创建表格合成数据集可能导致的隐私风险,发现恶意攻击者可以通过选择与训练样本最接近的合成样本对隐私构成重大威胁,并且当攻击者具有对生成模型的知识或黑盒访问时,隐私威胁显著增加,而使用多目标优化的重构攻击甚至会增加识别机密样本的风险。
Mar, 2024
本研究提出了一种名为深度生成对齐网络(DGCAN)的深度生成模型,采用新颖的模型域对齐算法通过形状保持损失和低层次统计匹配损失来最小化合成图像和真实图像之间的深度特征空间差异,实验表明,将这些新生成的数据用于训练现成的分类器可以显著提高性能。
Jan, 2017
本研究提出了使用基于相似性保持生成对抗网络模型 SimPGAN,将目标域中未标记图像转化为原始分类器的解决方案,通过在多个真实监控数据集上的全面实验,研究结果表明,该算法优于现有的基于跨数据集的无监督人员重新识别算法。
Jun, 2018
本研究着眼于深入评估和比较对于机器学习的通用合成数据的对抗训练效果,并旨在使用未标记的真实数据条件下的合成 - 真实生成模型将合成图像转化为更真实的风格,并通过定性和定量指标进行广泛的性能评估和比较。
Apr, 2023