复制数据集:室内空间的数字复制品
本研究提供了一份可扩展性强、真实感更强、规模更大、变异性更强、且在训练和评估深度学习方法、基准测试同时定位和映射(SLAM)方面有更广泛用途的数据集,以支持计算机视觉领域的研究。我们使用数百万个专业室内设计和制作级家具资产进行高分辨率和高帧率视频序列渲染,并支持各种摄像头类型以及惯性测量。同时,我们展示了稀疏和密集 SLAM 算法的基准测试结果。
Sep, 2018
该研究介绍了 Habitat-Matterport 3D (HM3D) 数据集,它是一种大型建筑规模的三维重建数据集,用于训练具有智能体能力的 AI 代理。该数据集比现有的数据集在物理规模、重建的完整度和视觉保真度方面具有更好的性能,并使训练出的代理获得了最高的性能表现。
Sep, 2021
本文介绍了一种名为 Hypersim 的、具备完整的室内场景计算机视觉理解的合成数据集,该数据集为场景、对象和像素级别提供完整的标注信息,并且评估了数据集的生成成本,并证明了使用该数据集进行预训练可以显著改善语义分割和 3D 形状预测任务的性能。
Nov, 2020
使用照相机与软件进行拍摄与处理,采用 3D 扫描仪进行加速,生成真实物体的准确虚拟模型与网格模型,并在项目网站上提供所有生成的模型和图像。
Feb, 2024
提出了一种创造大规模室内场景的照片级真实数据集的新框架,可提供外观、布局、语义标签、高质量变化自由的 BRDF 和复杂照明等显著真实的基准数据,可用于逆向渲染、场景理解和机器人学,与物理引擎结合可创建具有摩擦系数等真实场景对应关系的虚拟机器人环境。
Jul, 2020
本文介绍了一种包含近千个三维对象模型及超过 84 万个现实世界的 RGB 和深度图像数据集,旨在填补现有研究中缺乏的三维多视图重建的真实数据基准。该数据集通过半自动方式实现相机位置与物体姿态的精准标注,为形状重建、物体姿态估计、形状检索等 3D 应用提供了可能。数据集已开放,包含注释工具和评估基准源代码。
Mar, 2022
本文介绍 Matterport3D 数据集,包含 10,800 个全景视图,通过 RGB-D 图片提供了 90 个建筑尺度的场景的表面重建、相机姿态和 2D、3D 语义分割注释等,可用于多种计算机视觉任务,如关键点匹配、视图重叠预测、颜色预测等。
Sep, 2017
通过提出多传感器混合房间数据集(MuSHRoom),对几个著名管道进行基准测试,并提出一种新的方法,可以在消费级设备上实现 3D 重建和新视角合成的融合,从而促进了提高 3D 重建和高质量渲染的性能。
Nov, 2023
研究利用合成数据半自动化创建数据集并将其应用于对象视角估计这一重要任务,使用最先进的渲染软件在视点空间中密集地呈现图像,研究渲染参数对估计性能的影响,并表明合成数据的泛化不比两个真实图像数据集之间的领域适应更困难,并且将合成图像与少量真实数据结合使用可以提高估计准确性。
Mar, 2016
SceneNet RGB-D 提供了室内场景轨迹的大规模真实渲染,为场景理解和几何计算机视觉问题提供像素级完美的标签数据,以及适用于从头开始使用 RGB-D 输入的数据驱动的计算机视觉技术的预训练数据集,并且也提供了探索 3D 场景标注任务的基础。
Dec, 2016