SIDAR: 用于对齐与修复的合成图像数据集
该研究介绍了一个由 NVIDIA 深度学习数据合成器生成的新的、可公开获取的图像数据集,用于目标检测、姿势估计和跟踪应用。该数据集包含 144k 个立体图像对,将三个真实环境中的 18 个相机视角合成,其中实验对象包括最多 10 个随机选择的物体和飞行干扰器。
Aug, 2020
本文提出半合成数据集的方法,通过接近真实场景纹理的渲染方式,以减少合成数据集与真实数据集之间的差距,进而提高立体匹配性能,此方法在 Middlebury 数据集上取得了 SOTA 的成绩,在 KITTI 和 ETH3D 数据集上也取得了竞争性的结果。
Jan, 2021
本文提出了一种方法,在不修改深度神经网络本身的结构下,通过半合成图像增加深度学习模型对于姿势和光照变化的适应能力,从而提升了现代人脸识别系统在具有挑战性的 IJB-A 数据集上的识别性能。
Apr, 2017
本文探讨使用有针对性的合成数据增强 - 结合游戏引擎模拟和 sim2real 风格转移技术 - 填补视觉任务的真实数据集中的空缺。在三种不同的计算机视觉任务中(停车位检测,车道检测和单 ocular 深度估计),实证研究一致表明,将合成数据与真实数据混合训练能够显著提高交叉数据集的泛化性能。
Apr, 2020
合成数据用于训练深度神经网络在计算机视觉应用中的重要性,重点探讨了在生产环境中使用的合成数据生成过程以及通过不同组合方法在减少仿真与现实差距方面的改进。
Nov, 2023
利用深度学习管道,同时对一系列畸变图像进行对齐和重构,并通过 Swin Transformer 模型分析顺序图像数据,通过注意力图检测相关图像内容并与离群值和伪影区分开来,利用神经特征图作为经典关键点检测器的替代方法,从而提供稠密图像描述符以寻找图像间的点对应关系,并运用此来计算粗略的图像对齐并探索其局限性。
Oct, 2023
通过提取运动信息(光流和二维关键点),我们展示了神经网络方法可以在仅使用 SURREAL 合成数据的情况下与最先进的基于真实 3D 序列训练的方法相媲美地从 3D 视角估计人体姿态。
Jul, 2019
为了增强自动驾驶系统的有效性,本文提出了 ARSim,一个全自动、综合和模块化框架,用于通过将 3D 合成对象与真实多视图图像数据相结合,来提高真实世界场景的多样性和覆盖范围。实验结果表明,在各种自动驾驶感知任务上,使用增强数据集训练的网络性能更优。
Mar, 2024
本篇论文提出 SyntheticP3D 数据集和 CC3D 方法,结合这两种方法可以实现在只用 10% 的真实数据的情况下,与当前最先进的模型在物体位姿估计方面取得了可与之媲美结果,在采用 50% 的真实数据时还超越了 SOTA 模型 10.4%。
May, 2023
本研究展示了合成数据的各种发展和应用方向,其中讨论合成数据的基本计算机视觉问题、室内外场景合成及数据应用、机器人仿真环境、合成数据在隐私相关应用方面的重要性,同时概括了如何改进和生产合成数据的替代方法。其次,介绍了合成数据转化后的真实应用存在的问题,最后,着重强调了未来在合成数据研究方面的最有潜力的方向。
Sep, 2019