基于 Transformer 的无分组 3D 物体检测
本文提出了 RBGNet 框架,一种基于投票的 3D 检测器,用于从点云中精确检测 3D 物体。该框架使用基于射线的特征分组模块来聚合物体表面的点特征,以了解物体的形状以增强聚类特征,从而预测 3D 边界框。此外,作者还提出了一种新颖的前景偏置采样策略,以在下采样过程中采样更多物体表面上的点,并显着提高检测性能。
Apr, 2022
本文提出了一种用于 3D 物体检测的弱监督点云变换器框架,旨在降低对训练所需监督的数量,以减少对 3D 数据集进行注释的高成本,通过使用投票网络选择高质量的预设锚点,将信息提炼到学生网络和教师网络。
Sep, 2023
本文中,我们提出了一种改进的两阶段 3D 目标检测框架 CT3D,其中利用高质量的区域提议网络和基于通道的 Transformer 架构来同时执行提议感知嵌入和通道方式的上下文聚合,以获取更准确的目标预测,具有优秀的性能和可伸缩性,尤其是在 KITTI 测试 3D 检测基准中,众车类别的 AP 为 81.77%,优于现有最先进的 3D 检测器。
Aug, 2021
本文探讨了利用深度学习在 3D 物体检测中,针对使用 RGB-D 数据在室内和室外场景下进行点云识别所面临的挑战以及如何提高效率。通过利用成熟的 2D 物体检测器和先进的 3D 深度学习来提高区域建议与对象本地化的精度,以取得高回收甚至小目标检测的良好性能。在 KITTI 和 SUN RGB-D 3D 检测基准上进行了评估,相比现有技术取得了显著的大幅度升级,并具有实时性能。
Nov, 2017
3DETR 是一种基于 Transformer 的端到端目标检测模型,适用于 3D 点云,相较于现有的检测方法,它需要最少的修改,可以通过将 3D 领域知识整合进去得到进一步的改进,在 ScanNetV2 数据集上,相比于 VoteNet 基线具有 9.5% 更好的性能,并且适用于其他 3D 任务。
Sep, 2021
信息瓶颈限制了 3D 物体检测的准确性和可扩展性,因此我们提出了基于 Transformer 的 PVTransformer 架构,通过用注意模块替换 PointNet 池化操作来改善点到体的聚合函数,从而在广泛使用的 Waymo Open Dataset 上实现了卓越的表现。
May, 2024
提出了一种用于室内场景的新型超点分组网络,通过对原始点云进行超点划分,利用几何感知的投票模块调整超点和物体中心之间的空间关系,采用超点注意力层和超点 - 体素融合层来探索提案内的一致性表示,利用超点来基于动态感受野进行有效的多次匹配,实现室内一阶段 3D 物体检测的最新性能。
Dec, 2023
通过引入两个旨在准确高效地检测和定位三维空间中物体的 3D 物体检测框架,本文目的是解决当前 3D 检测的灵活性和可伸缩性不足的问题,并在 KITTI 数据集和大规模 Waymo 数据集上取得最先进的性能。
Jun, 2024
本文介绍了一种基于 Fast Point Transformer 的新型轻量级自我关注层的方法,用于对大型 3D 场景进行处理和提高计算效率,并应用于 3D 语义分割和 3D 检测,具有与基于体素的最佳方法相竞争的准确性和比 Point Transformer 更快的推理时间。
Dec, 2021
本文提出了一种基于 transformer 架构的特征融合网络,以解决 3D 目标跟踪中的关键问题。该网络利用自注意机制捕捉点云中不同区域之间的相互关系,并使用交叉注意力将目标提示信息融入特征中,从而提高相似度计算的效率。在 KITTI 数据集上的实验结果表明,该方法取得了最新的最佳表现。
Oct, 2021