PVT-SSD:使用点 - 体素变换的单级三维物体探测器
信息瓶颈限制了 3D 物体检测的准确性和可扩展性,因此我们提出了基于 Transformer 的 PVTransformer 架构,通过用注意模块替换 PointNet 池化操作来改善点到体的聚合函数,从而在广泛使用的 Waymo Open Dataset 上实现了卓越的表现。
May, 2024
该论文介绍了一种基于体元和投影双分支特征提取的 3D 目标检测器,以解决信息丢失的问题。通过融合具有丰富局部语义信息的体元特征和投影特征,该方法在特征提取阶段减少了由投影引起的局部信息丢失,并在比较实验中取得了良好的性能。
Aug, 2023
本文介绍了 Voxel Transformer (VoTr),这是一种用于 3D 目标检测的新型有效的基于体素的 Transformer 骨干网络。我们通过引入基于 Transformer 的体系结构来解决仅使用体素的 3D 卷积骨干不能有效地捕获大的上下文信息的问题,并且我们提出的 VoTr 在 KITTI 议会和 Waymo 开放数据集上展现了良好的性能。
Sep, 2021
本文提出一种名为 3DSSD 的轻量级且高效的基于点云的三维单级物体检测器,采用了融合采样策略以及候选生成层、无锚点回归头、三维中心性分配策略的结构设计,其精度和速度都表现出很好的平衡,并且在 KITTI 和 nuScenes 数据集上取得了比同类方法显著更好的性能。
Feb, 2020
本文介绍了一种基于 Fast Point Transformer 的新型轻量级自我关注层的方法,用于对大型 3D 场景进行处理和提高计算效率,并应用于 3D 语义分割和 3D 检测,具有与基于体素的最佳方法相竞争的准确性和比 Point Transformer 更快的推理时间。
Dec, 2021
本文提出了一种新的单级三维检测方法 HVPR,它将点云的体素特征与点特征有效且高效地集成到一个伪图像的混合三维表示中,从而实现了三维对象的定位。同时,我们提出了一种 Attentive Multi-scale Feature Module(AMFM),用于考虑点云的稀疏和不规则分布,以提取具有尺度感知的特征,并在 KITTI 数据集上验证了我们方法的有效性和效率。
Apr, 2021
本文介绍了动态稀疏体素变换器(DSVT),它是一个用于室外 3D 感知的单步幅基于体素的转换器骨干。为了有效处理稀疏点云,我们提出了动态稀疏窗口注意力,这将每个窗口中的一系列局部区域根据其稀疏性划分,并以完全并行的方式计算所有区域的特征。在本文中,我们的模型实现了具有广泛 3D 感知任务的最先进的性能,并且可以轻松通过 TensorRT 进行实时推理速度(27Hz)的部署。
Jan, 2023
3D 目标检测中的突出问题是大规模室外场景下对象尺度的变化,需要同时获取远距离和细粒度信息的特征。为了解决这一问题,我们提出了 MsSVT++,一种创新的混合尺度稀疏体素变换器,通过分治方法同时捕捉两类信息。使用棋盘采样策略和哈希映射在 3D 体素空间中进行稀疏的体素采样和聚集操作,以减轻基于窗口的变换器的计算复杂性。同时,引入了中心投票模块,将混合尺度上下文信息丰富的新体素朝着对象中心进行集成,从而提高了精确的对象定位。广泛的实验证明,我们的单阶段检测器在 MsSVT++ 的基础上,对不同的数据集始终表现出优异的性能。
Jan, 2024
提出了一种基于时间 LiDAR 的三维物体检测方法,利用点云和轨迹特征相结合的点轨迹变压器和长短期记忆,实现了对三维物体的高效检测。对大规模 Waymo 数据集进行了广泛实验,证明了该方法在性能上优于现有的方法。
Dec, 2023
提出了一种名为 PointVoxel-RCNN(PV-RCNN)的 3D 物体检测框架,可以使用点云实现准确的物体检测,使用了 3D voxel 卷积神经网络和基于 PointNet 的集合抽象相结合的方法深度学习了更具有区分性的点云特征,并使用 RoI-grid 池化方法编码具有可比性的特征从而实现了更准确的 3D 检测效果。
Dec, 2019