多视角多视图 3D 物体检测的多视图关注上下文化

CVPRMay, 2024

多视角多视图 3D 物体检测的多视图关注上下文化

Multi-View Attentive Contextualization for Multi-View 3D Object Detection

Xianpeng Liu, Ce Zheng, Ming Qian, Nan Xue, Chen Chen...

TL;DR多视角注意力上下文化是一种简单而有效的方法，用于在基于查询的多视图三维目标检测中改进二维到三维特征提取。

Abstract

We present multi-view attentive contextualization (MvACon), a simple yet effective method for improving 2d-to-3d feature lifting in query-based multi-view 3D (MV3D) object detection. Despite remarkable progress w

multi-view attentive contextualization 2d-to-3d feature lifting mv3d object detection dense attention-based lifting sparse attention-based lifting

发现论文，激发创造

3M3D: 多视角、多路径、多表征 3D 目标检测

提出了一种基于多视图轴自注意力和局部 ROI 自注意力的多路径多表示 3D 物体检测方法，通过稀疏浮动查询和密集 BEV 查询的多重表示进一步提高了性能，对于自动驾驶系统具有重要意义。

Feb, 2023

特征透视变换在多视角检测中的应用

本研究提出了一种新的多视角检测系统 MVDet，采用基于鸟瞰图的无 Anchor 盒方法来聚合视图信息并在地平面特征图上应用大内核卷积。在新引入的合成数据集 MultiviewX 上的结果表明，相比于现有方法在 Wildtrack 数据集上的最新技术，该方法提高了 14.1% 的 MODA 性能。

Jul, 2020

基于自注意力的上下文感知 3D 物体检测（SA-Det3D）

本研究提出了两种三维物体检测的自我注意力模型，即通过将卷积特征与自我注意力特征相结合，将成对的自我注意力机制纳入最新的基于 BEV、体素和点云检测器，最终在 KITTI 验证集上证明了模型精度的一致提高，同时减少了运算量和计算成本，实现了更好的参数效率和计算效率。

Jan, 2021

学习使用辅助单目上下文有助于单目三维物体检测

该论文提出了一种不需要额外信息的单目 3D 物体检测方法 MonoCon，利用辅助任务学习单目上下文来帮助检测，在训练中利用了一组丰富的二维监督信号来学习辅助参数，该方法在 KITTI 基准测试中在车辆类别上实现了最佳表现，并获得了较高的检测速度。

Dec, 2021

用于自动驾驶的多视角三维物体检测网络

该论文研究了自动驾驶场景下高精度的 3D 物体检测问题。其提出了 Multi-View 3D networks（MV3D）框架，该框架采用多传感器融合技术，将 LIDAR 点云和 RGB 图像作为输入，并预测有方向的 3D 界限框。实验表明，该方法在 3D 定位和 3D 检测任务方面的表现优于现有技术约 25％和 30％，在 2D 检测中也表现出显著的技术优势。

Nov, 2016

MLCVNet：多层上下文 VoteNet 用于三维物体检测

本文提出 Multi-Level Context VoteNet（MLCVNet）方法，通过使用自注意力机制和多尺度特征融合来捕捉多层次的上下文信息，从而建立在当前先进技术 VoteNet 的基础之上，在投票和分类阶段引入三个上下文模块来编码不同层次的上下文信息，从而有效提高检测精度，在 SUN RGBD 和 ScanNet 等具有挑战性的 3D 目标检测数据集上取得了新的检测性能最佳表现。

Apr, 2020

面向鸟瞰视角的多视角三维物体检测领域泛化

本论文提出了一种名为 DG-BEV 的方法，通过将同态转换的测度深度预测转换为尺度不变深度来获得强健的深度预测，并使用单应性进行动态透视增强以增加外参参数的多样性，并通过多个伪域值修改对抗性训练损失来构建特征表示，从而显著减轻了目标领域的性能下降。

Mar, 2023

基于透视矫正的通用多摄像头三维物体检测

通过与 2D 相机平面结果对齐的方法，本研究提出了一种新颖的多相机三维目标检测方法，确保持一致且准确的检测结果。该方法通过视角校正，将鸟瞰视图特征渲染为多视图地图，并纠正了这些地图的透视偏差，利用隐含的前景体来连接相机与鸟瞰视图平面。该两步过程促进了视角和上下文无关特征的学习，对于准确地检测不同视角、相机参数和环境条件下的目标至关重要。此外，该方法采用基于模型的不可知的方法，而不需要额外的推理成本和对真实场景注释，从而促进了各种模型的无缝集成和简化部署。实验结果在领域泛化和无监督领域自适应方面明确展示了其有效性。

Oct, 2023

SCA-PVNet：自我与交叉注意力的点云和多视图聚合用于 3D 对象检索

我们提出了基于点云和多视角图像的自我和交叉注意力聚合方法 (SCA-PVNet) 来进行三维目标检索，通过设计两种特征聚合模块（即 In-Modality Aggregation Module (IMAM) 和 Cross-Modality Aggregation Module (CMAM)），通过自我和交叉注意力机制有效地融合多视角特征和点云特征，从而获得目标检索的最终描述符。我们在从小到大范围的三个数据集上进行了大量实验和分析，证明了提出的 SCA-PVNet 方法在三维目标检索领域的卓越性能。

Jul, 2023

LiDAR 点云 3D 物体检测的端到端多视角融合

本文提出了一种新颖的多视角融合算法 (MVF)，它能够从鸟瞰视角和透视视角有效地学习利用互补信息，其中采用了动态体素化方法。在 Waymo 开放数据集和 KITTI 数据集上的评估表明，MVF 模型显著提高了检测精度。

Oct, 2019