- 多相关等式变压器网络与稠密连接用于 3D 单物体跟踪
稀疏 LiDAR 点云数据仍然存在挑战,因此本文提出了一种多相关 Siamese Transformer 网络,通过在每个阶段末尾基于稀疏支柱进行特征相关,以学习搜索区域的特征并保持模板的独立特征。该算法在 KITTI、nuScenes 和 - ECCV基于梯度的单目深度估计不确定性
本文提出了一种基于深度神经网络的后验不确定性估计方法,通过辅助损失函数的梯度来估计不确定性,避免依赖于地面真实信息的损失定义,可以实现对固定深度估计模型的有状态压制应用。该方法在 KITTI 和 NYU 深度 V2 基准测试中实现了最先进的 - ECCVDID-M3D: 单目 3D 物体检测中实例深度解耦
本文提出了一种将实例深度复杂度降低的方法,即将实例深度重新定义为实例表面视觉深度(视觉深度)和实例属性深度(属性深度)的组合,并将 3D 定位不确定性分解为视觉深度不确定性和属性深度不确定性,取得了 KITTI 数据集的最新的最佳结果
- CVPR无监督点云补全结构化潜空间学习
本文提出了一种新的框架,学习了一个统一的、结构化的潜在空间,其中包括映射相关局部点云的多个完整的形状和遮挡代码对,并将这些代码合并以获取它们在统一潜在空间中的表示,通过建立这样一个统一的和结构化潜在空间,可以实现更好的局部 - 完整几何一致 - CVPR稀疏融合稠密:基于深度补全的高质量 3D 检测
本文提出了一种基于 SFD 框架的多模态方法,采用由深度补全生成的伪点云来解决点云稀疏性问题,并提出一种新的 3D RoI 融合策略 3D-GAF 来更好地利用不同类型点云的信息。同时,本文还介绍了通过数据增强等措施让多模态框架利用 LID - MM从体素到点云:基于 IoU 引导的用于点云的三维物体检测的体素到点云解码器
本研究提出了一种 IoU 引导的两阶段 3D 物体检测器,并结合采用 “残差体素到点云” 和 “ROI 对齐” 来提高检测精度,实验表明该方法在 KITTI 数据集上具有明显优势。
- OCM3D:基于物体的单目三维物体检测
本文提出了一种适用于单目三维目标检测的新型基于物体的体素表示法,能够有效地组织噪点云在体素网格内,并能够精确定位对象在三维空间中的位置。通过考虑三维物体与相关二维框之间的关系,我们将单目三维目标检测中的置信度机制进行了分解,并在 KITTI - SIENet:用于三维点云物体检测的空间信息增强网络
使用 LIADAR 进行三维物体检测时,由于点云密度不均衡,距离传感器更远的物体采集的点较少,导致检测精度下降。为解决这一挑战,作者提出了名为 SIENet 的二阶段三维物体检测框架,其中设计了空间信息增强模块和多分支的混合范式区域提案网络 - CVPR基于遮挡引导的 3D 点云场景流估计
本文介绍了一种新的 3D 场景流估计架构 OGSF-Net,它能够更准确地预测空间流,并在 Flyingthings3D 和 KITTI 等关键数据集中达到最先进的结果,是首个在点云上估计 3D 场景流的架构。
- ECCV通过渐进式基于种群的增强改进 3D 物体检测
本文介绍了第一次自动设计 3D 目标检测数据增强策略的尝试,通过学习优化增强策略,将搜索空间缩小并采用前一次迭代中发现的最佳参数,使 PPBA 算法在 KITTI 3D 检测测试集上大幅优化了 StarNet 检测器的适度难度汽车、行人和骑 - BirdNet+: LiDAR 鸟瞰图中端对端 3D 物体检测
本文提出了一种全端到端的三维物体检测框架,可以仅使用 Bird's Eye View 图像自动推断取向的三维包围盒,并且该方法在 KITTI 三维物体检测基准中超出了现有方法的性能并获得了最佳结果。
- 重构轨迹和轨迹重构
本研究提出了 MOTSFusion 方法,使用 3D 重建数据改进目标追踪,并使用 2D 光流组成短轨迹,使用 3D 运动信息将这些轨迹合并为长期轨迹,实现对长时间目标完全遮挡下的跟踪。在 KITTI 数据集上的实验表明,相对于其他方法,本 - Frustum ConvNet:滑动视锥以汇聚局部点特征进行遮挡不变的三维物体检测
本文介绍了一种名为 Frustum ConvNet 的新方法,可以从点云中识别 3D 物体。该方法首先在 RGB 图像中给出 2D 区域的建议,然后为每个区域建立一个锥体序列,并使用获得的锥体组合局部点。Frustum ConvNet 通过 - CVPRMagicVO: 通过深度双向递归卷积神经网络实现单目视觉里程计的端到端计算
本文提出了 MagicVO 框架,基于卷积神经网络和双向 LSTM,对单眼视觉里程计问题进行求解,实验结果表明,MagicVO 在位姿准确性和泛化能力方面优于传统视觉里程计系统。
- 使用循环生成网络的无监督敌对深度估计
本文提出了一种基于对抗学习框架的无监督深度学习方法,用于预测深度图,通过学习预测校准立体相机设置下两个图像视图之间的对应场,提出了一个有两个生成子网络的架构,它们通过对抗训练共同用于重建视差图并相互约束和监督。实验结果表明,该模型可以有效地 - PointFlowNet: 从点云学习刚体运动估计的表示
该论文提出了一种使用深度神经网络从非结构化点云中估计三维运动的方法,同时也能预测场景中物体的三维边界框和刚体运动。作者还采用虚拟物体增强真实扫描数据来训练网络,并与传统技术和基于学习的技术进行了全面比较。
- 深入探究行人
本文研究卷积神经网络在行人检测中的应用。本研究表明,即使没有明确建立问题的模型,也可以获得具有竞争力的性能,探讨了不同训练数据(包括预训练)对卷积神经网络行人检测器性能的影响,标志谷数据集和 KITTI 数据集的实验证明本方法的有效性。