Syn-Mediverse: 医疗设施智能场景理解的多模态合成数据集

Aug, 2023

Syn-Mediverse: 医疗设施智能场景理解的多模态合成数据集

Syn-Mediverse: A Multimodal Synthetic Dataset for Intelligent Scene Understanding of Healthcare Facilities

Rohit Mohan, José Arce, Sassan Mokhtar, Daniele Cattaneo, Abhinav Valada

TL;DR通过建立综合医疗设施的超逼真多模态合成数据集，揭示了下一代自主医疗机器人在感知和理解复杂的环境方面的能力，并提供了一个在线评估基准，旨在进一步推动对医疗设施场景理解的研究。

Abstract

Safety and efficiency are paramount in healthcare facilities where the lives of patients are at stake. Despite the adoption of robots to assist medical staff in challenging tasks such as complex surgeries, human expertise is still indispensable. The next generation of →

healthcare facilities autonomous healthcare robots deep learning models synthetic dataset scene understanding

发现论文，激发创造

提升家庭环境安全与福祉的综合多模态数据集

本研究提供了一个合成的多模态数据集，通过融合来自 3D 虚拟空间模拟器的视频数据与描绘活动时空上下文的知识图谱，该数据集旨在用于社会问题的知识图谱推理挑战（KGRC4SI），重点是识别和解决家庭环境中的危险情况，该数据集对于研究人员和从业者开发创新解决方案，以识别人类行为以提升安全和福祉而言，可作为宝贵的资源对公众开放。

Jan, 2024

InteriorNet: 大规模多传感器照片真实室内场景数据集

本研究提供了一份可扩展性强、真实感更强、规模更大、变异性更强、且在训练和评估深度学习方法、基准测试同时定位和映射（SLAM）方面有更广泛用途的数据集，以支持计算机视觉领域的研究。我们使用数百万个专业室内设计和制作级家具资产进行高分辨率和高帧率视频序列渲染，并支持各种摄像头类型以及惯性测量。同时，我们展示了稀疏和密集 SLAM 算法的基准测试结果。

Sep, 2018

Hypersim：一个逼真的室内全景场景综合数据集

本文介绍了一种名为 Hypersim 的、具备完整的室内场景计算机视觉理解的合成数据集，该数据集为场景、对象和像素级别提供完整的标注信息，并且评估了数据集的生成成本，并证明了使用该数据集进行预训练可以显著改善语义分割和 3D 形状预测任务的性能。

Nov, 2020

TRoVE：将道路场景数据集转换成逼真的虚拟环境

本研究提出了一种用已有数据集进行数据注释以生成多模态数据的方法，以优化智能车辆系统中的数据模拟，实现高保真模拟并增加样本多样性并成功改善了语义分割的实验效果。

Aug, 2022

医疗保健中的合成数据

本文旨在介绍模拟器生成数据在医疗保健领域的应用与潜在优势，同时指出了其存在的潜在风险和问题。

Apr, 2023

Care3D：真实机器人护理环境下的主动三维物体检测数据集

为了解决劳动力短缺对卫生部门的影响，本研究提供了一个真实环境的数据集，用于开发辅助机器人及进行 3D 物体检测，同时提供一个房间内的真实数据来评估直接在卫生机器人上运行的 SLAM 算法。

Oct, 2023

使用合成数据理解现实世界室内场景的 SceneNet

本文研究场景理解问题，通过使用计算机图形学生成合成 3D 场景，以解决手动收集大量数据问题，从而避免了收集数据的麻烦和昂贵成本。通过使用深度数据作为输入仅使用 RGB-D 系统的深度数据，我们在 NYUv2 数据集上的表现相当于最先进的 RGBD 系统，并在 SUN RGB-D 数据集上设置了基准。文章还探讨了生成合成图像或视频数据，以及分析影响性能增益的不同因素。

Nov, 2015

双对抗生成网络生成的合成医学图像

该研究提出了一种基于生成对抗网络的新型双阶段流水线，用于从医学图像数据中生成合成医学图像，并开发了 SynthMed 在线数据库以促进医学图像任务的发展。

Sep, 2017

EDEN: 封闭式花园场景的多模态合成数据集

为了促进机器学习方法在农业和园艺等自然应用领域的发展，我们提出了多模式合成的封闭花园场景数据集（EDEN），该数据集包括来自 100 多个花园模型的超过 300K 张图像，并注释了各种低 / 高级别视觉模态，包括语义分割、深度、表面法线、内在颜色和光流，实验结果表明，我们的数据集的深度网络预训练对于计算机视觉中的两个重要任务（语义分割和单眼深度预测）具有积极的影响。

Nov, 2020

Synscapes：用于街景解析的照片级合成数据集

使用逼真的渲染技术创建的 Synscapes 合成数据集在街景分割的训练和验证方面展示了最先进的结果，并研究了网络在合成数据上推断时的行为，并分析了现有分割和检测模型，为计算机视觉系统的分析提供了细微的信息。

Oct, 2018