基于数据驱动的纸板箱定位的新型合成数据工具
本研究旨在评估使用游戏引擎在托盘分割的机器学习中生成合成训练数据的可行性。研究开发了一款工具,可从 3D 模型以像素完美的准确性自动生成大量带注释的训练数据,并且比手动方法更快地进行。使用 Mask R-CNN 管道进行图像分割,对于单独的托盘,AP50 达到了 86%。
Apr, 2023
本文提出了一个自然场景文本识别的框架,使用深度神经网络模型和合成数据训练三种不同方式的单词识别模型,能够显著提高对标准数据集的性能表现,而且不需要任何人工标记数据和零数据采集成本。
Jun, 2014
使用合成数据在机器学习中能够节省大量时间,本研究旨在改进先前实施的方法,以实现仓库环境中托盘的实例分割。通过使用合成生成的域随机数据和通过 Unity 生成的数据,该研究在真实数据评估中对叠放和垛放托盘类别分别实现了 69% 和 50% mAP50 的性能提升。此外,在光线较暗的环境下评估模型时,其性能有显著影响,当在亮度降低 80% 的图像上进行评估时,mAP50 降至 3% 左右。此研究还创建了一个使用 YOLOv8 和 SAM 的两阶段检测器,但其性能不稳定。与 Unity 生成数据相比,使用域随机数据的性能改进可忽略。
Feb, 2024
合成数据用于训练深度神经网络在计算机视觉应用中的重要性,重点探讨了在生产环境中使用的合成数据生成过程以及通过不同组合方法在减少仿真与现实差距方面的改进。
Nov, 2023
本文介绍了一种使用神经放射场的全可微合成数据管道,可在不需要人力劳动的情况下按需生成数据,从而使得目标任务的准确性最大化。作者在合成和实际的物体检测任务中展示了方法的有效性,并引入了一个可用于真实场景中具有不同姿势的物体检测的新数据集和基准测试 (YCB-in-the-Wild)。
Jul, 2022
本文介绍了一种系统性的方法来生成高度逼真、注释的合成数据,以用于计算机视觉任务的深度神经网络的训练。该方法的主要贡献是一种程序性的世界建模方法,能够产生高度可变性和物理准确性的图像合成,并且它是从手工建模的虚拟世界和在实时应用中使用的近似图像合成方法中脱颖而出的。我们的方法的优点包括灵活性、物理精确性、可扩展的图像合成、隐式广泛的类和特征覆盖以及完整的数据自检测以进行注释,所有这些都有助于质量和成本的效率。在本文中,我们以自动驾驶车辆和机器人导航的语义分割为主要应用,使用合成数据对多个深度学习体系结构进行了训练和微调。评估表明,我们的方法提高了神经网络的性能,即使是适度的实施工作也能产生最先进的结果。
Oct, 2017
本文讨论了使用合成训练数据来优化神经网络参数与近似贝叶斯模型的相关性,并展示了其在验证码破解等任务中的应用和成功实验结果,并在此基础上探讨了使用合成数据训练神经网络需要考虑的因素和如何确保模型的泛化能力。
Mar, 2017
使用深度学习估计 3D 中由稀疏、无序点云场景表示的流形的拓扑结构,通过合成的标记数据集训练神经网络并评估其估计流形的层面的能力,与基于持续同调的现有拓扑数据分析工具相比,探讨了深度学习模型提取这些特征的优势,并使用语义分割提供额外的几何信息以及拓扑标签,比较了常见的点云多层感知机和 Transformer 网络的可行性,在模拟数据上的实验结果支持假设,即在复杂的合成数据生成帮助下,神经网络能够执行基于分割的拓扑数据分析,尽管研究集中在模拟数据上,但所达到的准确性暗示了未来使用实际数据的潜力。
Sep, 2023
本文介绍了一种创新的方法来生成一个逼真、多样、平衡和带标签的数据集,用于集装箱在码头环境下的视觉检查任务,并且我们证明了生成的合成标记数据集可以用于训练可以在实际环境中使用的深度神经网络。此外,我们提供了第一个开放的合成标记数据集 “SeaFront”。
Jun, 2023