面向城市环境中的鲁棒机器人三维感知：UT 校园对象数据集

Sep, 2023

面向城市环境中的鲁棒机器人三维感知：UT 校园对象数据集

Towards Robust Robot 3D Perception in Urban Environments: The UT Campus Object Dataset

Arthur Zhang, Chaitanya Eranki, Christina Zhang, Ji-Hwan Park, Raymond Hong...

TL;DR我们介绍了 UT Campus Object Dataset（CODa），这是在德克萨斯大学奥斯汀分校采集的移动机器人自我中心感知数据集。我们的数据集包含 8.5 小时的多模态传感器数据：来自 128 通道 3D LiDAR 和两个 1.25MP RGB 相机的同步 3D 点云和立体 RGB 视频，帧率为 10fps；来自额外的 0.5MP 传感器的 RGB-D 视频，帧率为 7fps，并带有 40Hz 的 9-DOF IMU 传感器。我们提供了 58 分钟的地面真值注释，其中包含 130 万个含有 53 个语义类别的实例 ID 的 3D 边界框，以及 5000 帧的城市地形的 3D 语义注释和伪地面真值定位。使用 CODa，我们实证地表明：1）与现有数据集相比，使用 CODa 进行训练的城市环境下的 3D 对象检测性能显著提高，即使采用最先进的领域自适应方法；2）传感器特定的微调改善了 3D 对象检测准确性，3）在 CODa 上进行预训练相比于在 AV 数据集上进行预训练，可以提高跨数据集城市环境下的 3D 对象检测性能。使用我们的数据集和注释，我们发布了使用已建立的度量标准进行 3D 对象检测和 3D 语义分割的基准。在未来，CODa 基准将包括其他任务，如无监督的对象发现和重新识别。我们在 Texas Data Repository 上公开发布了 CODa，还提供了预训练模型、数据集开发包和交互式数据集查看器。我们期望 CODa 能成为在城市环境中自我中心的 3D 感知和自主导航规划方面的研究的宝贵数据集。

Abstract

We introduce the ut campus object dataset (CODa), a mobile robot egocentric perception dataset collected on the University of Texas Austin Campus. Our dataset contains 8.5 hours of multimodal sensor data: synchronized 3D point clouds and stereo RGB video from a 128-channel 3D LiDAR and

ut campus object dataset urban settings 3d object detection 3d semantic segmentation autonomous navigation

发现论文，激发创造

CODA：自动驾驶中目标检测真实路口数据集

该研究旨在解决传统自动驾驶中常见的物体识别偏差的问题，提出了一个具有挑战性的 CODA 数据集，以检测标准物体检测器的性能下降，为研究可靠的真实世界自动驾驶提供帮助。

Mar, 2022

Cityscapes 3D: 面向 9 自由度车辆检测的数据集和基准

该研究提出一种基于单目 RGB 图像的三维车辆检测方法，为此创建了 Cityscapes 3D 数据集，包含了所有类型车辆的三维标注信息，使得与基于 lidar 的方法相比具有更高效率和更大范围的标注信息。此外，研究将 2D 实例分割与 3D 包围盒成对提供，以便多任务学习。这对自动驾驶技术有着很重要的意义。

Jun, 2020

TUMTraf V2X 协作感知数据集

合作感知技术对提升自主车辆能力和道路安全具有多方面的好处，使用路侧传感器以及车载传感器可以提高可靠性和扩展传感器范围。我们提出了一种合作多模态融合模型 CoopDet3D 和感知数据集 TUMTraf-V2X，用于合作式三维物体检测和跟踪任务。通过多次实验，我们证明了相对于车载摄像头 - LiDAR 融合模型，我们的 CoopDet3D 摄像头 - LiDAR 融合模型在三维 mAP 上实现了 + 14.36 的提高。最后，我们将我们的数据集、模型、标注工具和开发套件公开发布在我们的网站上。

Mar, 2024

用于开发和基准测试主动视觉的数据集

该论文使用真实影像，聚焦日常室内环境下机器人视觉任务的模拟，构建新的公共数据集。该数据集可用于机器人视觉任务中的物体检测、主动视觉模拟和基于深度学习的强化学习下的下一步动作预测。在使用数据集的过程中，作者发现现有物体检测研究最大的问题是机器人视角对物体尺度，遮挡和方向的影响。

Feb, 2017

CoPeD - 推进多机器人协同感知：一个实际环境中的综合数据集

过去十年中，虽然单一机器人感知取得了重大进展，但多机器人协同感知的研究仍未被广泛探索。本文提出了一个开创性的全面真实世界的多机器人协同感知数据集，用于推动这一领域的研究。我们的数据集利用了空中 - 地面机器人协同的未发掘潜力，具有不同的空间视角、互补的机器人移动性、覆盖范围和传感器模态。它提供了原始传感器输入、姿态估计和可选的高级感知注释，以适应各种研究兴趣。与现有主要设计用于同时定位和地图构建（SLAM）的数据集相比，我们的设置确保了多样化的传感器视角范围和足够的重叠以促进多机器人协同感知算法的研究。我们通过多个协同感知任务定性地证明了这个数据集的价值。我们相信这项工作将在多模态协同感知中解锁高级场景理解的潜在研究。

May, 2024

Care3D：真实机器人护理环境下的主动三维物体检测数据集

为了解决劳动力短缺对卫生部门的影响，本研究提供了一个真实环境的数据集，用于开发辅助机器人及进行 3D 物体检测，同时提供一个房间内的真实数据来评估直接在卫生机器人上运行的 SLAM 算法。

Oct, 2023

Occ3D：面向自动驾驶的大规模三维占据预测基准

本研究提出了一种新的 3D 占据预测任务，旨在从多视图图像中估计对象的详细占据和语义信息，并介绍了 Coarse-to-Fine Occupancy (CTF-Occ) 网络模型，该模型在 3D 占据预测任务中表现出优越的性能。

Apr, 2023

A*3D 数据集：面向复杂环境的自动驾驶

本文介绍了一份新的挑战性 A*3D 数据集，以满足自动驾驶研究任务在高度多样化的环境中的需求，并采用基于 RGB 图像和 LiDAR 数据的丰富多样的场景、时间和天气情况，其中包括重度遮挡和大量的夜间框架，共包含 39K 帧、7 个类别和 230K 个 3D 对象注释。对 A*3D 数据集进行广泛的 3D 对象检测基准评估，对高密度、白天 / 黑夜等各种属性给出了有趣的见解。

Sep, 2019

协作伪装对象检测：大规模数据集和基准测试

全文提供了对一项名为协作伪装目标检测（CoCOD）的新任务的全面研究，其目的是同时从一组相关图像中检测具有相同属性的伪装目标。为此，我们细致地构建了首个大规模数据集 CoCOD8K，该数据集包含 8528 张高质量且精选图像，带有目标遮罩注释，覆盖 5 个超类别和 70 个子类别。该数据集涵盖了各种自然和人工伪装场景，具有多样的目标外观和背景，因此对于 CoCOD 来说是一个非常具有挑战性的数据集。此外，我们提出了 CoCOD 的首个基准模型，名为双向分支网络（BBNet），该模型分别在单个图像内和图像组内探索和整合共伪装线索，以实现对给定图像中伪装目标的准确检测。这是通过一种图像间协作特征探索（CFE）模块、一种图像内目标特征搜索（OFS）模块和一种局部 - 全局细化（LGR）模块实现的。我们在提议的 CoCOD8K 数据集上对 18 种最先进的模型进行了性能评估，其中包括 12 种 COD 算法和 6 种 CoSOD 算法，采用了 5 种广泛使用的评估指标。广泛的实验表明了所提出方法的有效性以及与其他竞争方法相比显著更优越的性能。我们希望我们提出的数据集和模型能够促进 COD 社区的发展。该数据集、模型和结果将可在此网址获取: https://this-URL

Oct, 2023

CORP：面向校园路边感知任务的多模态数据集

该论文介绍了第一个面向校园场景的多模态道路感知任务的公共基准数据集 CORP，该数据集拥有多维信息的标注，旨在提供校园和其他居民区域内的多模态感知挑战。

Apr, 2024