WildScenes：大规模自然环境下的二维和三维语义分割基准

Dec, 2023

WildScenes：大规模自然环境下的二维和三维语义分割基准

WildScenes: A Benchmark for 2D and 3D Semantic Segmentation in Large-scale Natural Environments

Kavisha Vidanapathirana, Joshua Knights, Stephen Hausler, Mark Cox, Milad Ramezani...

TL;DR近期在语义场景理解方面的进展主要得益于城市环境中具有语义注释的双模态（相机和激光雷达）数据集的可用性。然而，为了实现自然、非结构化环境下的语义感知应用，包括自然保护、搜救、环境监测和农业自动化，我们也需要具有语义注释的数据集。因此，我们介绍了 WildScenes，一个双模态基准数据集，其中包括自然环境下多个大规模遍历，包括高分辨率 2D 图像和密集 3D 激光雷达点云的语义注释，以及准确的 6 自由度姿态信息。我们的 3D 语义标签通过一种高效的自动化过程得到，该过程将多视角中的人工标注 2D 标签转移到 3D 点云中，从而避免了在 3D 中进行昂贵和耗时的人工注释。我们引入了关于 2D 和 3D 语义分割的基准，并评估了各种最新的深度学习技术，以展示在自然环境中语义分割中的挑战。我们提出了供标准基准和域自适应基准使用的训练 - 验证 - 测试划分，并利用一种自动划分生成技术来确保类别标签分布的平衡。该数据集、评估脚本和预训练模型将在接受之后发布于该 URL。

Abstract

Recent progress in semantic scene understanding has primarily been enabled by the availability of semantically annotated bi-modal (camera and lidar) datasets in urban environments. However, such annotated datasets are also needed for natural, unstructured environments to enable semanti

semantic scene understanding wildscenes bi-modal benchmark dataset 2d and 3d semantic segmentation domain adaptation

发现论文，激发创造

基于语言的室内野外 3D 语义分割

本文提出新的计算机视觉方法，使 3D 语义分割可以更好地理解具有更多类别和自然分布的真实环境，并在新的扩展基准上测试，使用语言驱动的预训练方法使特征更鲁棒。实验结果表明，我们的方法在提出的基准上始终优于现有技术。

Apr, 2022

面向城市尺度三维点云的语义分割：数据集、基准和挑战

本文介绍了一个由三个英国城市中 7.6 平方公里的城市景观组成的大规模城市照相测量点云数据集，其中每个 3D 点都被标记为 13 个语义类别之一，并通过基于现有算法的综合分析来识别了几个关键问题。

Sep, 2020

Semantic3D.net：一个新的大规模点云分类基准

本文介绍了一个新的 3D 点云分类基准数据集，其中包含超过 40 亿个手动标记的点，用于数据密集型的（深度）学习方法。使用深度卷积神经网络（CNNs）作为工作马的初始提交已经显示出相对于现有技术具有显著的性能改进。我们提供了基线方法描述和通过我们的在线系统提交方法之间的比较。我们希望 Semantic3D.net 能够为 3D 点云标注中的深度学习方法铺平道路。

Apr, 2017

WildRefer: 基于多模态视觉数据和自然语言的大规模动态场景中的 3D 物体定位

本研究提出了一种基于自然语言描述和多模式视觉数据的大规模动态场景的 3D 视觉定位任务的方法，并且通过利用图像的外观特征、点云中的位置和几何特征以及连续输入帧中的动态特征，匹配语言中的语义特征。我们提出了两个新的数据集，STRefer 和 LifeRefer，这些数据集对于野外 3D 视觉定位的研究具有重要意义，并且有着提升自动驾驶和服务机器人发展的巨大潜力。广泛的比较和消融研究证明，我们的方法在两个提出的数据集上实现了最先进的性能。

Apr, 2023

室内场景理解中的 2D-3D - 语义数据联合

该文介绍了一个大规模室内空间数据集，其中包含 2D、2.5D 和 3D 接口的多种相互注册的模态，并具有实例级别的语义和几何注释。该数据集使得可以开发联合和跨模态学习模型，以及可能利用大规模室内空间中存在的规律性的无监督方法。

Feb, 2017

Panoptic nuScenes：LiDAR 全图分割和跟踪的大规模基准测试

介绍了扩展了 nuScenes 数据集的大规模全景 nuScenes 基准数据集，以便对动态城市环境的全景场景理解方法进行研究和评估，同时提出了各种分割和跟踪任务的强基线方法，并提出了面向实例的新型 PAT 指标，解决了现有指标的局限性。

Sep, 2021

城市景观语义理解数据集

为解决现有数据集不能很好地捕捉真实城市场景的复杂性，我们引入了 Cityscapes—— 一个基准套件和大规模数据集，用于像素级和实例级语义标注的方法的训练和测试。

Apr, 2016

Campus3D：用于层次式室外场景理解的摄影测量点云基准

本文介绍了一个丰富注释的 3D 点云数据集，以及用于分层分割任务的有效学习框架。提出了一种基于多任务学习和分层集成的两阶段方法，包括一种考虑不同层次之间一致性的度量。实验结果表明了所提出方法的优越性和分层注释的潜在优势。

Aug, 2020

ConstScene: 在施工环境中推进鲁棒语义分割的数据集和模型

针对建筑工地的多样挑战，介绍了一个新的语义分割数据集，以增强目标检测模型在不同的天气和环境条件下的训练和评估，从而促进其在实际建筑应用中的适应能力和可靠性。

Dec, 2023

nuScenes：自动驾驶的多模态数据集

本文介绍了 nuTonomy 场景数据集，其中包含了自动驾驶车辆所有的传感器：6 个相机，5 个雷达和 1 个激光雷达，每个场景长达 20 秒，并标注了 23 个类别和 8 个属性的三维边界框。同时，定义了新的 3D 检测和跟踪指标，并提供了激光雷达和基于图像的检测和跟踪的基线。

Mar, 2019