Habitat-Matterport 3D 语义数据集

Oct, 2022

Habitat-Matterport 3D Semantics Dataset

Karmesh Yadav, Ram Ramrakhya, Santhosh Kumar Ramakrishnan, Theo Gervet, John Turner...

TL;DR介绍了规模、质量和多样性都高于以往数据集的 HM3DSEM 数据集，该数据集使用纹理信息进行像素精度的对象边界注释，使用该数据集训练的策略在 Object Goal Navigation 任务上表现优异，引入该数据集还带来了 Habitat ObjectNav Challenge 参与者数量的增加。

Abstract

We present the Habitat-Matterport 3d semantics (HM3DSEM) dataset. HM3DSEM is the largest →

dataset 3d semantics object annotations navigation

发现论文，激发创造

Habitat-Matterport 3D 数据集（HM3D）：1000 个大规模 3D 环境用于基于身体的人工智能

该研究介绍了 Habitat-Matterport 3D (HM3D) 数据集，它是一种大型建筑规模的三维重建数据集，用于训练具有智能体能力的 AI 代理。该数据集比现有的数据集在物理规模、重建的完整度和视觉保真度方面具有更好的性能，并使训练出的代理获得了最高的性能表现。

Sep, 2021

室内场景理解中的 2D-3D - 语义数据联合

该文介绍了一个大规模室内空间数据集，其中包含 2D、2.5D 和 3D 接口的多种相互注册的模态，并具有实例级别的语义和几何注释。该数据集使得可以开发联合和跨模态学习模型，以及可能利用大规模室内空间中存在的规律性的无监督方法。

Feb, 2017

Matterport3D: 室内环境下 RGB-D 数据的学习

本文介绍 Matterport3D 数据集，包含 10,800 个全景视图，通过 RGB-D 图片提供了 90 个建筑尺度的场景的表面重建、相机姿态和 2D、3D 语义分割注释等，可用于多种计算机视觉任务，如关键点匹配、视图重叠预测、颜色预测等。

Sep, 2017

生态环境合成场景数据集（HSSD-200）：3D 场景尺度和真实性权衡对于目标导航的分析

本文介绍 Habitat Synthetic Scene Dataset 数据集，并使用该数据集测试导航代理在逼真的三维环境中的泛化能力，研究合成 3D 场景数据集规模和真实性对于训练全方位代理寻找和导航至目标对象的影响，表明在保证场景真实性的前提下规模优势逐渐缩小，数据量更小的数据集在零样本泛化方面有优势。

Jun, 2023

拥挤城市场景下全方位 3D 多目标检测和跟踪的 H3D 数据集

提出了一个大规模的全景三维多目标检测和跟踪数据集（H3D），包括 160 个高度互动的交通场景，总共 27,721 帧并提供对应的数据标注；作者还提出了标注方法来加速标注过程并为全方位三维多目标检测和跟踪算法创建基准测试。最终，讨论了算法以及未来研究中可能出现的错误来源。

Mar, 2019

InteriorNet: 大规模多传感器照片真实室内场景数据集

本研究提供了一份可扩展性强、真实感更强、规模更大、变异性更强、且在训练和评估深度学习方法、基准测试同时定位和映射（SLAM）方面有更广泛用途的数据集，以支持计算机视觉领域的研究。我们使用数百万个专业室内设计和制作级家具资产进行高分辨率和高帧率视频序列渲染，并支持各种摄像头类型以及惯性测量。同时，我们展示了稀疏和密集 SLAM 算法的基准测试结果。

Sep, 2018

面向城市尺度三维点云的语义分割：数据集、基准和挑战

本文介绍了一个由三个英国城市中 7.6 平方公里的城市景观组成的大规模城市照相测量点云数据集，其中每个 3D 点都被标记为 13 个语义类别之一，并通过基于现有算法的综合分析来识别了几个关键问题。

Sep, 2020

3D 语义地图网络：3D 多目标重新识别中的地图构建

我们研究了通过实体巡游进行的 3D 多目标重新识别任务，提出了 3D Semantic MapNet (3D-SMNet) 模型，它包括一个操作于 RGB-D 视频的 3D 物体检测器和一个可微的物体匹配模块，通过生成的实验和真实数据的联合训练，在真实世界的重新布置场景中取得了显著的改进。

Mar, 2024

用于多视角三维重建的现实数据集

本文介绍了一种包含近千个三维对象模型及超过 84 万个现实世界的 RGB 和深度图像数据集，旨在填补现有研究中缺乏的三维多视图重建的真实数据基准。该数据集通过半自动方式实现相机位置与物体姿态的精准标注，为形状重建、物体姿态估计、形状检索等 3D 应用提供了可能。数据集已开放，包含注释工具和评估基准源代码。

Mar, 2022

Semantic3D.net：一个新的大规模点云分类基准

本文介绍了一个新的 3D 点云分类基准数据集，其中包含超过 40 亿个手动标记的点，用于数据密集型的（深度）学习方法。使用深度卷积神经网络（CNNs）作为工作马的初始提交已经显示出相对于现有技术具有显著的性能改进。我们提供了基线方法描述和通过我们的在线系统提交方法之间的比较。我们希望 Semantic3D.net 能够为 3D 点云标注中的深度学习方法铺平道路。

Apr, 2017