Matterport3D: 室内环境下 RGB-D 数据的学习

Sep, 2017

Matterport3D: 室内环境下 RGB-D 数据的学习

Matterport3D: Learning from RGB-D Data in Indoor Environments

Angel Chang, Angela Dai, Thomas Funkhouser, Maciej Halber, Matthias Nießner...

TL;DR本文介绍 Matterport3D 数据集，包含 10,800 个全景视图，通过 RGB-D 图片提供了 90 个建筑尺度的场景的表面重建、相机姿态和 2D、3D 语义分割注释等，可用于多种计算机视觉任务，如关键点匹配、视图重叠预测、颜色预测等。

Abstract

Access to large, diverse rgb-d datasets is critical for training RGB-D scene understanding algorithms. However, existing datasets still cover only a limited number of views or a restricted scale of spaces. In this paper, we introduce →

rgb-d datasets matterport3d panoramic views semantic segmentation computer vision tasks

发现论文，激发创造

室内场景理解中的 2D-3D - 语义数据联合

该文介绍了一个大规模室内空间数据集，其中包含 2D、2.5D 和 3D 接口的多种相互注册的模态，并具有实例级别的语义和几何注释。该数据集使得可以开发联合和跨模态学习模型，以及可能利用大规模室内空间中存在的规律性的无监督方法。

Feb, 2017

ScanNet: 室内场景丰富注释的 3D 重建

本文介绍了 ScanNet 数据集的构建，该数据集包含 2.5M 的视图和 1513 个场景，提供了 3D 摄像机姿势、表面重构和语义分割等信息，并表明使用此数据集可以在 3D 场景理解任务中实现最先进的性能。

Feb, 2017

用于多视角三维重建的现实数据集

本文介绍了一种包含近千个三维对象模型及超过 84 万个现实世界的 RGB 和深度图像数据集，旨在填补现有研究中缺乏的三维多视图重建的真实数据基准。该数据集通过半自动方式实现相机位置与物体姿态的精准标注，为形状重建、物体姿态估计、形状检索等 3D 应用提供了可能。数据集已开放，包含注释工具和评估基准源代码。

Mar, 2022

Habitat-Matterport 3D 数据集（HM3D）：1000 个大规模 3D 环境用于基于身体的人工智能

该研究介绍了 Habitat-Matterport 3D (HM3D) 数据集，它是一种大型建筑规模的三维重建数据集，用于训练具有智能体能力的 AI 代理。该数据集比现有的数据集在物理规模、重建的完整度和视觉保真度方面具有更好的性能，并使训练出的代理获得了最高的性能表现。

Sep, 2021

ARKitScenes: 使用移动 RGB-D 数据的 3D 室内场景理解多样化真实世界数据集

介绍了 ARKitScenes，这是第一个使用 RGB-D 数据集且具有广泛可用深度传感器的室内场景认知数据集，并分析了数据集的有用性，包括用于 3D 对象检测和颜色引导深度上采样。

Nov, 2021

InteriorNet: 大规模多传感器照片真实室内场景数据集

本研究提供了一份可扩展性强、真实感更强、规模更大、变异性更强、且在训练和评估深度学习方法、基准测试同时定位和映射（SLAM）方面有更广泛用途的数据集，以支持计算机视觉领域的研究。我们使用数百万个专业室内设计和制作级家具资产进行高分辨率和高帧率视频序列渲染，并支持各种摄像头类型以及惯性测量。同时，我们展示了稀疏和密集 SLAM 算法的基准测试结果。

Sep, 2018

R3DS：用于全景场景理解的现实链接 3D 场景

我们介绍了与 Matterport3D 全景相应的合成 3D 场景数据集 Reality-linked 3D Scenes (R3DS)。与以往工作相比，R3DS 具有更完整和更密集的场景，其中的对象与全景中的真实观察结果相关联。R3DS 还提供了对象的支持层次结构和匹配的对象集（例如，围绕餐桌的相同椅子）。总体而言，R3DS 包含了 19K 个由 100 多个对象类别中的 3,784 个不同 CAD 模型表示的对象。我们展示了 R3DS 在全景场景理解任务上的有效性。我们发现：1）在 R3DS 上的训练可以获得更好的泛化性能；2）在 R3DS 上进行的支持关系预测相比启发式计算的支持改善了性能；3）R3DS 为未来的全景场景理解研究提供了具有挑战性的基准。

Mar, 2024

3DRealCar：一个自然环境中的 RGB-D 汽车数据集，具备 360 度视角

我们提出了第一个大规模的 3D 真实汽车数据集，名为 3DRealCar，具有高容量、高质量和高多样性的特点，以及可用于改进与汽车相关的各种 2D 和 3D 任务的潜力。

Jun, 2024

SceneNet RGB-D: 500 万逼真合成室内运动轨迹图像及地面真实性数据集

SceneNet RGB-D 提供了室内场景轨迹的大规模真实渲染，为场景理解和几何计算机视觉问题提供像素级完美的标签数据，以及适用于从头开始使用 RGB-D 输入的数据驱动的计算机视觉技术的预训练数据集，并且也提供了探索 3D 场景标注任务的基础。

Dec, 2016

非中心全景室内数据集

首次提出了用于室内场景理解的非中心全景数据集，包含 2574 个 RGB 非中心全景图像，每个图像都有深度图和注释，以获取室内空间的布局和相机姿态。

Jan, 2024