OriCon3D: 利用方向和置信度的有效 3D 物体检测
本文提出了一种使用单张图片进行三维目标检测与姿态估计的方法,通过使用深度卷积神经网络来回归相对稳定的三维目标属性,并使用二维边界框提供的几何约束来组合这些估计,从而产生完整的三维边界框。
Dec, 2016
本研究针对T-LESS数据集中具有旋转对称轴的物体进行了3D目标检测和姿态估计,通过引入CNN等技术,实现了色彩图像的2D投影识别和姿态预测方案,并使用限制范围的训练和分类器优化,最终在LINEMOD数据集上将正确注册的RGB帧从73.7%提高至89.3%,并对仅使用彩色图像的Occlusion数据集进行了测试。
Mar, 2017
本文研究从立体图像中检测3D物体的问题,提出了使用3D锚点构建物体级对应的方法来增强检测和定位的深度神经网络,使用经济高效的渠道重新加权策略来增强表示特征。在KITTI数据集上,这些方法都优于现有方法。
Jun, 2019
H3DNet是一个用于物体检测和识别的卷积神经网络,通过预测一组混合的几何图元,即BB中心,BB面中心和BB边缘中心以实现更准确的物体边界框检测,并利用匹配和细化模块将物体边界框分类为检测到的对象并对其几何参数进行微调。
Jun, 2020
KM3D-Net 提出了一种基于 RGB 图像和关键点的单次检测框架,通过结合完全卷积模型、几何约束和不依赖 CAD 模型、深度生成器,以及一种有效的半监督训练策略,实现了卓越的检测表现,并超过以前所有的最先进方法。
Sep, 2020
介绍了Objectron数据集,旨在推进3D物体检测等新兴研究领域的发展,数据集中有九个类别的注释短视频,包含了1400万个注释图像和14819个注释视频。同时,提出了一种新的评估指标,3D Intersection over Union,证明了数据集在推进3D物体检测任务方面的有用性。提供了在该数据集上训练的基准模型。
Dec, 2020
本文提出了一种新的单级三维检测方法HVPR,它将点云的体素特征与点特征有效且高效地集成到一个伪图像的混合三维表示中,从而实现了三维对象的定位。同时,我们提出了一种Attentive Multi-scale Feature Module(AMFM),用于考虑点云的稀疏和不规则分布,以提取具有尺度感知的特征,并在KITTI数据集上验证了我们方法的有效性和效率。
Apr, 2021
该论文研究了如何训练一个来自多个数据集的统一 3D 检测器,提出了一种名为 Uni3D 的方法来解决数据级别和分类学级别的差异,证明了该方法的有效性并对进一步的 3D 泛化研究具有启发意义。
Mar, 2023
通过与ImageNet数据集相结合,ImageNet3D数据集提供了200个类别的2D和3D信息,从而为构建具有更强的通用性目标级三维理解的视觉模型提供了潜力。
Jun, 2024