3D 复制粘贴:单目 3D 检测的物体插入的物理可行性
本文介绍了一种基于数据增强的方法,通过多次利用已有数据,使用现实世界中的数据模拟给点云数据进行物体检测和语义分割训练。此方法在 KITTI 物体检测和 SemanticKITTI 语义分割挑战赛中取得了显著的性能提升。
Jun, 2022
本文研究了无监督的物体发现问题。引入了 POD-Net 模型,通过物理学原理,从视频中精确提取出各个物体的 3D 几何和位置,同时推断物体的属性,从而可以用于推断物理事件。
Jul, 2020
研究了数据扩充在提高自动驾驶中三维目标检测中的应用,提出了一种新的方法,该方法可以更加灵活地构建整体物体、自由定位和旋转物体,并相应地应用自遮挡和外部遮挡,通过隐藏点拆除算法实现自遮挡和外部遮挡,最终说明该算法可显著提高 mAP 性能。
Mar, 2023
提出了一种基于虚拟场景的弱监督方法用于 3D 物体检测,利用合成的 3D 形状将弱标签转换成更强的虚拟场景,并再次利用虚拟标签去改善真实标签和更好地训练检测器,同时提出了更具挑战性的室内 3D 物体检测基准测试。
Mar, 2022
通过使用隐式的场景元素特征表征来区分合理和不合理的人体和物体对齐,在机器人感知中提出了一个以图形为基础的整体三维人体场景重建的方法,该学习方法实现了与现有基于优化的方法相当的三维重建质量,且不需要推理时间优化,适用于机器人导航等潜在应用中。
Jul, 2023
本文提出了一种利用立体照相机生成 3D 物体点云,并将深度估计和物体检测任务以同一度量空间进行统一的方法,其性能优于现有方法,具有更快的推理时间。
Jan, 2021
使用 2D 标签和对象运动的物理知识,我们提出了一种新颖的方法,可以从单个校准摄像机的单个图像中精确地定位 3D 对象的位置,而无需昂贵的 3D 标签,即使在训练期间从未见过这些信息,我们的模型也能推断出潜在的第三维度。通过在合成和真实数据集上评估,我们的方法在真实数据实验中能够达到均方误差仅为 6 厘米,结果表明这种方法在无法收集 3D 数据进行训练的情况下学习 3D 对象定位估计的潜力。
Oct, 2023
该研究提出了一种基于深度神经网络和形态感知的三维目标检测方法,利用二维关键点和对应的三维坐标以及二维 / 三维的几何约束提高检测性能,并在公共数据集 KITTI 上实现了最新的性能。
Aug, 2021
通过研究路面对 3D 检测提供的额外信息,提出了一种嵌入式神经网络,能够充分利用这些应用程序特定的先验知识,从而实现使用单个 RGB 摄像机确定环境中对象的位置和方向的三维目标检测。
Feb, 2021
通过训练一个鲁棒的单目三维物体检测模型,采用包括多样化的三维和二维数据集、有选择地训练不同类别注释的数据集和使用二维标签的伪三维训练方法,我们可以获得具有强大泛化能力和对只有二维标签的新数据集表现出色的模型。
Oct, 2023