基于数据驱动的纸板箱定位的新型合成数据工具

May, 2023

基于数据驱动的纸板箱定位的新型合成数据工具

Novel Synthetic Data Tool for Data-Driven Cardboard Box Localization

Lukáš Gajdošech, Peter Kravár

TL;DR本文提出一种用于工业应用中的神经网络自动生成数据集的自动化数据生成工具，通过纸盒的程序模型演示了系统的能力，证明了生成的可训练性的合成数据的有用性，并公开了样本合成数据。

Abstract

Application of neural networks in industrial settings, such as automated factories with bin-picking solutions requires costly production of large labeled data-sets. This paper presents an automatic data generation

neural networks automated factories data generation procedural model synthetic data

发现论文，激发创造

使用游戏引擎从合成数据中检测货盘

本研究旨在评估使用游戏引擎在托盘分割的机器学习中生成合成训练数据的可行性。研究开发了一款工具，可从 3D 模型以像素完美的准确性自动生成大量带注释的训练数据，并且比手动方法更快地进行。使用 Mask R-CNN 管道进行图像分割，对于单独的托盘，AP50 达到了 86％。

Apr, 2023

基于人工神经网络和合成数据的自然场景文本识别

本文提出了一个自然场景文本识别的框架，使用深度神经网络模型和合成数据训练三种不同方式的单词识别模型，能够显著提高对标准数据集的性能表现，而且不需要任何人工标记数据和零数据采集成本。

Jun, 2014

利用合成数据提升托盘检测的准确性

使用合成数据在机器学习中能够节省大量时间，本研究旨在改进先前实施的方法，以实现仓库环境中托盘的实例分割。通过使用合成生成的域随机数据和通过 Unity 生成的数据，该研究在真实数据评估中对叠放和垛放托盘类别分别实现了 69% 和 50% mAP50 的性能提升。此外，在光线较暗的环境下评估模型时，其性能有显著影响，当在亮度降低 80% 的图像上进行评估时，mAP50 降至 3% 左右。此研究还创建了一个使用 YOLOv8 和 SAM 的两阶段检测器，但其性能不稳定。与 Unity 生成数据相比，使用域随机数据的性能改进可忽略。

Feb, 2024

在生产环境中构建综合数据以弥合仿真与真实世界之间的差距

合成数据用于训练深度神经网络在计算机视觉应用中的重要性，重点探讨了在生产环境中使用的合成数据生成过程以及通过不同组合方法在减少仿真与现实差距方面的改进。

Nov, 2023

神经相似度：使用 NeRF 学习生成训练数据

本文介绍了一种使用神经放射场的全可微合成数据管道，可在不需要人力劳动的情况下按需生成数据，从而使得目标任务的准确性最大化。作者在合成和实际的物体检测任务中展示了方法的有效性，并引入了一个可用于真实场景中具有不同姿势的物体检测的新数据集和基准测试 (YCB-in-the-Wild)。

Jul, 2022

汽车应用中的合成数据生成的程序建模和基于物理的渲染

本文介绍了一种系统性的方法来生成高度逼真、注释的合成数据，以用于计算机视觉任务的深度神经网络的训练。该方法的主要贡献是一种程序性的世界建模方法，能够产生高度可变性和物理准确性的图像合成，并且它是从手工建模的虚拟世界和在实时应用中使用的近似图像合成方法中脱颖而出的。我们的方法的优点包括灵活性、物理精确性、可扩展的图像合成、隐式广泛的类和特征覆盖以及完整的数据自检测以进行注释，所有这些都有助于质量和成本的效率。在本文中，我们以自动驾驶车辆和机器人导航的语义分割为主要应用，使用合成数据对多个深度学习体系结构进行了训练和微调。评估表明，我们的方法提高了神经网络的性能，即使是适度的实施工作也能产生最先进的结果。

Oct, 2017

使用合成数据训练神经网络是基于模型的推理

本文讨论了使用合成训练数据来优化神经网络参数与近似贝叶斯模型的相关性，并展示了其在验证码破解等任务中的应用和成功实验结果，并在此基础上探讨了使用合成数据训练神经网络需要考虑的因素和如何确保模型的泛化能力。

Mar, 2017

3D 数据拓扑分析的合成数据生成和深度学习

使用深度学习估计 3D 中由稀疏、无序点云场景表示的流形的拓扑结构，通过合成的标记数据集训练神经网络并评估其估计流形的层面的能力，与基于持续同调的现有拓扑数据分析工具相比，探讨了深度学习模型提取这些特征的优势，并使用语义分割提供额外的几何信息以及拓扑标签，比较了常见的点云多层感知机和 Transformer 网络的可行性，在模拟数据上的实验结果支持假设，即在复杂的合成数据生成帮助下，神经网络能够执行基于分割的拓扑数据分析，尽管研究集中在模拟数据上，但所达到的准确性暗示了未来使用实际数据的潜力。

Sep, 2023

使用合成数据训练深度网络：通过域随机化缩小现实差距

该研究提供了一种基于合成图像训练深层神经网络对象检测的系统，并探讨了领域随机化技术的重要性及其在检测 KITTI 数据集上的应用。

Apr, 2018

一种生成用于视觉集装箱检查的合成标记数据集的方法

本文介绍了一种创新的方法来生成一个逼真、多样、平衡和带标签的数据集，用于集装箱在码头环境下的视觉检查任务，并且我们证明了生成的合成标记数据集可以用于训练可以在实际环境中使用的深度神经网络。此外，我们提供了第一个开放的合成标记数据集 “SeaFront”。

Jun, 2023