本文提出了一种在三维点云中有效检测对象的方法,使用卷积神经网络并利用稀疏性,提出了基于特征中心投票方案的卷积层和L1正则化,实现了高效的大规模三维数据处理,并在KITTI物体检测基准测试中表现出优异的成果。
Sep, 2016
本文介绍了一种名为AFDetV2的单级anchor-free网络方法在3D检测中的应用,并证明其在Waymo开放数据集及nuScenes数据集上的表现优于以往所有单级和双级3D检测方法。该方法在第一阶段中能够准确地回归确定物体位置,无需为此执行第二阶段的调整。
Dec, 2021
提出了一个名为Omni3D的大型测试数据集,其中包含234k个图像,涵盖了98个类别和300万个实例。引入了Cube R-CNN模型,能够更好地检测和识别3D场景和物体。该数据集可用于加速对新数据集的学习和预训练。
Jul, 2022
本文探讨了通过分治策略进行开放式词汇3D点云检测的方法,该方法使用图像预训练模型来学习定位各种对象,并连接文本和点云表示,以便根据提示文本对新对象类别进行分类,从而实现开放式词汇3D目标检测,同时在ScanNet和SUN RGB-D数据集上实现了显著的性能提升。
Apr, 2023
本文综述了现有的三维点云分析技术及其算法、应用场景和目标,介绍了使用的数据集和评估指标,并比较了现有解决方案的性能,最后分析了当前技术面临的挑战和吸引人们注意的未来趋势。
Jun, 2023
MS$^{2}$3D是一个两阶段的三维检测框架,利用小尺寸的体素提取细粒度的局部特征和大尺寸的体素捕捉长程局部特征,通过多尺度语义特征点构建三维特征层并计算特征点与目标质心的偏移,以提高特征聚合的效率,在KITTI数据集和ONCE数据集上验证了该方法的有效性。
Aug, 2023
Object2Scene 和 L3Det 是用于开放词汇3D物体检测的首个方法,通过引入大规模的3D物体数据集,将物体插入到3D场景中来丰富3D场景数据集的词汇,并在不同数据集的3D对象之间缓解领域差异,并证实了其在OV-ScanNet-200基准测试中的有效性。
Sep, 2023
通过OpenCRB策略,本研究在3D目标检测中实现了相对较低的标注成本,并且在识别未知和已知目标类别方面表现出优越性和灵活性。
Oct, 2023
OV-Uni3DETR是一种统一的开放词汇3D检测器,通过循环模态传播实现,具有开放词汇的3D检测、模态统一、场景统一的优势,并以超过6%的性能优势超越了现有方法,在只使用RGB图像的情况下性能与以前的基于点云的方法相当甚至更好。
Mar, 2024
本研究解决了开放词汇3D物体检测中的数据稀缺问题,提出了一种新的框架ImOV3D,利用伪多模态表示综合图像和点云数据,克服了训练图像与测试点云之间的模态差距。通过有效的模态转换,ImOV3D在不依赖真实3D训练数据的情况下显著提升了检测性能,并在有限真实3D数据的微调下超越了先前的最佳模型。
Oct, 2024