BEV-LaneDet: 一种简单有效的 3D 车道线检测基线模型
本研究提出了一种新的方法来解决通过利用 2D 到 3D 车道重建过程底层的几何结构来摆脱单目 3D 车道检测问题的方法,并使用结构先验来实现从局部到全局的三维车道重建,通过直接从前视图图像中提取 BEV 车道信息和任务特定的数据增强方法来降低 2D 车道表示中的结构损失,提高广义性;实验证明,该方法在 82 FPS 的实时速度下优于现有方法 3.8%的 F-Score。
Jun, 2022
提出了一种新颖的端到端双视多模态三维车道检测框架 DV-3DLane,通过协同利用图像和激光雷达点的优势,在双视图空间中学习多模态特征并利用它们生成车道检测查询,实现准确的三维车道检测。在公开基准 OpenLane 上进行的广泛实验表明,DV-3DLane 具有高效性能,F1 得分提高了 11.2%,错误率大幅减少了 53.5%。
Jun, 2024
本文介绍了 ONCE-3DLanes 数据集,其中包含 211K 实际道路场景的 3D 车道标注,提出了自动生成高质量 3D 车道位置的数据集注释流程,同时提供了一种新的无锚点,无外部参考的方法 SALAD 来回归图像视图中的车道 3D 坐标。此外,还提供了一个新的评估度量标准,旨在促进 3D 车道检测领域的未来研究。
Apr, 2022
本文提出一种基于分解交叉注意机制的 3D 车道检测模型,通过学习车道特征和鸟瞰视图特征之间的交叉关系,实现了更准确的视图转换和车道检测。
Jun, 2023
本文提出一种名为 Anchor3DLane 的去除 bird-eye view 的单目 3D 车道检测方法,通过在三维空间定义 3D 车道锚点并将其投影到前视图特征上提取特征,并采用全局优化方法,大幅度提升了车道检测的精度。
Jan, 2023
PersFormer 是一种新型的端到端基于 Transformer 的单目 3D 车道检测器,该模型通过参考相机参数生成前视局部区域的鸟瞰图特征向量,并采用统一的 2D/3D 车道锚设计和辅助任务来同时检测 2D/3D 车道线,同时释放了针对车道检测以及其他工业相关的自动驾驶方法的大型真实世界 3D 车道数据集 OpenLane,该数据集包含 200,000 帧、880,000 个实例级车道、14 个车道类别以及场景标签和封闭路径对象注释,证明 PersFormer 在 3D 车道检测任务上明显优于竞争基线,并且在 OpenLane 的 2D 任务中与现有技术水平相当。
Mar, 2022
本文提出基于相机的 DNN 三维车道检测新方法,采用 BEV 矩形划分道路,结合深度特征嵌入建立车道段的参数模型和聚类方法实现道路的检测,尤其针对复杂的车道几何结构和曲率,同时输出一个基于学习的检测不确定性评估,实验证明效果显著。
Mar, 2020
我们提出了一个大规模的三维车道数据集 LiSV-3DLane,其中包含 2 万帧环视 LiDAR 点云,通过丰富的语义注释,捕捉了城市和高速公路环境中的复杂车道模式。为了解决稀疏的 LiDAR 数据在车道标注中的问题,我们利用车道线的几何特征和 LiDAR 数据的固有空间属性,设计了一个简单而有效的自动标注流程。我们还提出了一种新颖的基于 LiDAR 的三维车道检测模型 LiLaDet,将 LiDAR 点云的空间几何学习融入到基于 Bird's Eye View(BEV)的车道识别中。实验结果表明,LiLaDet 在 K-Lane 数据集和我们的 LiSV-3DLane 上的三维车道检测任务中优于现有的基于摄像头和 LiDAR 的方法。
Sep, 2023
3D 物体检测在俯视(Bird's-Eye-View)空间中最近成为自动驾驶领域的一种普遍方法。本研究提出了一种高效的基于 BEV 的 3D 检测框架 BEVENet,通过采用仅卷积的架构设计,克服了 ViT 模型的局限性,同时保持了 BEV 方法的有效性。实验证明,BEVENet 在 NuScenes 挑战赛中比当代最先进方法快 3 倍,同时在 NuScenes 验证数据集上获得 0.456 的平均精确度(mAP)和 0.555 的 nuScenes 检测分数(NDS),推断速度为 47.6 帧每秒。据我们所知,这是首次实现如此显著的 BEV 方法效率改进的研究,突显了它们在实际自动驾驶应用中的可行性提升。
Dec, 2023
本文介绍了一种名为 BEVDet 的算法,它能够基于 Bird-Eye-View 拍摄的视频进行 3D 目标检测,通过利用数据增强策略和升级最大值抑制策略来提高性能,同时在精度和时间效率之间实现出色的平衡。
Dec, 2021