BEVDet4D: 多相机 3D 物体检测中的时序线索利用
本文介绍了一种名为 BEVDet 的算法,它能够基于 Bird-Eye-View 拍摄的视频进行 3D 目标检测,通过利用数据增强策略和升级最大值抑制策略来提高性能,同时在精度和时间效率之间实现出色的平衡。
Dec, 2021
本文提出了一种基于时间立体的有效方法来处理三维物体检测中深度感知所固有的模糊性。其有效地选择了匹配候选项的比例,极大地减少了计算开销,设计了一种迭代算法来更新更有价值的候选项,使其适应于移动的候选项,并达到了比现有的 MVS 方法更好的性能。
Sep, 2022
动态 BEV(Bird's Eye View)是一种新的查询方法,利用动态查询和动态场景下的聚类以及注意力机制,有效地从局部和远距离特征中聚合信息,实现对复杂场景的迭代适应,进而提高三维物体检测的效率和性能,从而在查询式 BEV 物体检测领域取得了划时代的突破。
Oct, 2023
本文提出了一种名为 P2D 的新型三维物体检测模型,它将预测方案整合到检测框架中,显式提取和利用运动特征,以及引入基于预测物体信息的 Bird's-Eye-View(BEV)特征的新型时间特征聚合方法,结果表明,与基线相比,P2D 可以显著提高检测精度。
Jun, 2023
在自动驾驶领域中,我们提出了一种名为 HVDetFusion 的新的多模态检测算法,既支持纯相机数据作为检测输入,也能融合雷达数据和相机数据的输入,从而实现了具有全面三维检测输出的目标检测算法。该算法在目前的相机 - 雷达三维物体检测器中在具有挑战性的 nuScenes 测试集上实现了最新的技术水平,达到了 67.4%的 NDS。
Jul, 2023
提出了一个基于动态时间立体视觉策略的 3D 物体检测框架 BEVStereo++, 并通过使用运动补偿模块和长序列帧融合方法,实现了在 Waymo 和 nuScenes 数据集上的最先进表现 (SOTA)。
Apr, 2023
本文提出一种新的基于相机的鸟瞰图三维目标检测方法,称为 BEVDepth,通过使用显式深度监督、镜头感知深度估计模块、深度细化模块以及定制的高效八叉树池化和多帧机制,实现了 60.9%的 NDS。这是相机模型首次达到 60%以上的 NDS 得分。
Jun, 2022
RCBEVDet 是一种在鸟瞰视角下将雷达和相机融合的三维物体检测方法,通过设计 RadarBEVNet 网络进行雷达鸟瞰特征提取,并结合交叉注意力多层融合模块实现自动对齐和融合多模态特征,取得了领先于现有方法的检测结果。
Mar, 2024
SparseBEV 是一种全更稀疏的三维物体检测器,通过尺度自适应自注意力、自适应时空采样和自适应混合等关键设计,在 BEV 空间和图像空间中实现了优于稠密对应物的性能。
Aug, 2023
历史物体预测 (HoP) 新范式为多视角三维检测提供了更有效地利用时间信息的方法。我们的方法采用了短期和长期的时间解码器,并生成伪鸟瞰图特征,以预测历史时刻的物体集。在 NuScenes 数据集上的实验表明,与目前领先的三维物体检测器相比,HoP 可以有效提高检测性能。
Apr, 2023