Syn-Mediverse: 医疗设施智能场景理解的多模态合成数据集
本研究提供了一个合成的多模态数据集,通过融合来自 3D 虚拟空间模拟器的视频数据与描绘活动时空上下文的知识图谱,该数据集旨在用于社会问题的知识图谱推理挑战(KGRC4SI),重点是识别和解决家庭环境中的危险情况,该数据集对于研究人员和从业者开发创新解决方案,以识别人类行为以提升安全和福祉而言,可作为宝贵的资源对公众开放。
Jan, 2024
本研究提供了一份可扩展性强、真实感更强、规模更大、变异性更强、且在训练和评估深度学习方法、基准测试同时定位和映射(SLAM)方面有更广泛用途的数据集,以支持计算机视觉领域的研究。我们使用数百万个专业室内设计和制作级家具资产进行高分辨率和高帧率视频序列渲染,并支持各种摄像头类型以及惯性测量。同时,我们展示了稀疏和密集 SLAM 算法的基准测试结果。
Sep, 2018
本文介绍了一种名为 Hypersim 的、具备完整的室内场景计算机视觉理解的合成数据集,该数据集为场景、对象和像素级别提供完整的标注信息,并且评估了数据集的生成成本,并证明了使用该数据集进行预训练可以显著改善语义分割和 3D 形状预测任务的性能。
Nov, 2020
本研究提出了一种用已有数据集进行数据注释以生成多模态数据的方法,以优化智能车辆系统中的数据模拟,实现高保真模拟并增加样本多样性并成功改善了语义分割的实验效果。
Aug, 2022
为了解决劳动力短缺对卫生部门的影响,本研究提供了一个真实环境的数据集,用于开发辅助机器人及进行 3D 物体检测,同时提供一个房间内的真实数据来评估直接在卫生机器人上运行的 SLAM 算法。
Oct, 2023
本文研究场景理解问题,通过使用计算机图形学生成合成 3D 场景,以解决手动收集大量数据问题,从而避免了收集数据的麻烦和昂贵成本。通过使用深度数据作为输入仅使用 RGB-D 系统的深度数据,我们在 NYUv2 数据集上的表现相当于最先进的 RGBD 系统,并在 SUN RGB-D 数据集上设置了基准。文章还探讨了生成合成图像或视频数据,以及分析影响性能增益的不同因素。
Nov, 2015
该研究提出了一种基于生成对抗网络的新型双阶段流水线,用于从医学图像数据中生成合成医学图像,并开发了 SynthMed 在线数据库以促进医学图像任务的发展。
Sep, 2017
为了促进机器学习方法在农业和园艺等自然应用领域的发展,我们提出了多模式合成的封闭花园场景数据集(EDEN),该数据集包括来自 100 多个花园模型的超过 300K 张图像,并注释了各种低 / 高级别视觉模态,包括语义分割、深度、表面法线、内在颜色和光流,实验结果表明,我们的数据集的深度网络预训练对于计算机视觉中的两个重要任务(语义分割和单眼深度预测)具有积极的影响。
Nov, 2020
使用逼真的渲染技术创建的 Synscapes 合成数据集在街景分割的训练和验证方面展示了最先进的结果,并研究了网络在合成数据上推断时的行为,并分析了现有分割和检测模型,为计算机视觉系统的分析提供了细微的信息。
Oct, 2018