Jan, 2024

RSUD20K: 自动驾驶中的道路场景理解数据集

TL;DR公路场景理解在自动驾驶中至关重要,使机器能够感知视觉环境。本文介绍了 RSUD20K 数据集,它由来自孟加拉国道路的超过 20K 张高分辨率图像组成,包含 13 种物体的 130K 个边界框注释。我们的工作在以往努力的基础上显著改进,提供了详细的注释和更复杂的物体。我们对数据集进行了全面的研究,对各种最先进的目标检测器进行了基准测试,并探索了大型视觉模型作为图像注释器。