Matterport3D: 室内环境下 RGB-D 数据的学习
该文介绍了一个大规模室内空间数据集,其中包含 2D、2.5D 和 3D 接口的多种相互注册的模态,并具有实例级别的语义和几何注释。该数据集使得可以开发联合和跨模态学习模型,以及可能利用大规模室内空间中存在的规律性的无监督方法。
Feb, 2017
本文介绍了 ScanNet 数据集的构建,该数据集包含 2.5M 的视图和 1513 个场景,提供了 3D 摄像机姿势、表面重构和语义分割等信息,并表明使用此数据集可以在 3D 场景理解任务中实现最先进的性能。
Feb, 2017
本文介绍了一种包含近千个三维对象模型及超过 84 万个现实世界的 RGB 和深度图像数据集,旨在填补现有研究中缺乏的三维多视图重建的真实数据基准。该数据集通过半自动方式实现相机位置与物体姿态的精准标注,为形状重建、物体姿态估计、形状检索等 3D 应用提供了可能。数据集已开放,包含注释工具和评估基准源代码。
Mar, 2022
该研究介绍了 Habitat-Matterport 3D (HM3D) 数据集,它是一种大型建筑规模的三维重建数据集,用于训练具有智能体能力的 AI 代理。该数据集比现有的数据集在物理规模、重建的完整度和视觉保真度方面具有更好的性能,并使训练出的代理获得了最高的性能表现。
Sep, 2021
介绍了 ARKitScenes,这是第一个使用 RGB-D 数据集且具有广泛可用深度传感器的室内场景认知数据集,并分析了数据集的有用性,包括用于 3D 对象检测和颜色引导深度上采样。
Nov, 2021
本研究提供了一份可扩展性强、真实感更强、规模更大、变异性更强、且在训练和评估深度学习方法、基准测试同时定位和映射(SLAM)方面有更广泛用途的数据集,以支持计算机视觉领域的研究。我们使用数百万个专业室内设计和制作级家具资产进行高分辨率和高帧率视频序列渲染,并支持各种摄像头类型以及惯性测量。同时,我们展示了稀疏和密集 SLAM 算法的基准测试结果。
Sep, 2018
我们介绍了与 Matterport3D 全景相应的合成 3D 场景数据集 Reality-linked 3D Scenes (R3DS)。与以往工作相比,R3DS 具有更完整和更密集的场景,其中的对象与全景中的真实观察结果相关联。R3DS 还提供了对象的支持层次结构和匹配的对象集(例如,围绕餐桌的相同椅子)。总体而言,R3DS 包含了 19K 个由 100 多个对象类别中的 3,784 个不同 CAD 模型表示的对象。我们展示了 R3DS 在全景场景理解任务上的有效性。我们发现:1)在 R3DS 上的训练可以获得更好的泛化性能;2)在 R3DS 上进行的支持关系预测相比启发式计算的支持改善了性能;3)R3DS 为未来的全景场景理解研究提供了具有挑战性的基准。
Mar, 2024
我们提出了第一个大规模的 3D 真实汽车数据集,名为 3DRealCar,具有高容量、高质量和高多样性的特点,以及可用于改进与汽车相关的各种 2D 和 3D 任务的潜力。
Jun, 2024
SceneNet RGB-D 提供了室内场景轨迹的大规模真实渲染,为场景理解和几何计算机视觉问题提供像素级完美的标签数据,以及适用于从头开始使用 RGB-D 输入的数据驱动的计算机视觉技术的预训练数据集,并且也提供了探索 3D 场景标注任务的基础。
Dec, 2016