基于稠密三维流的单目视觉里程计与稠密三维建图学习
本文提出了一种单目视觉里程计算法,它结合了基于几何方法和深度学习的思想,并利用两个卷积神经网络进行深度估计和光流估计。在 KITTI 数据集上的实验表明,该算法具有较强的鲁棒性和良好的性能。
Sep, 2019
使用深度神经网络进行图像生成任务以提取高级特征,进而估计视觉里程碑的深度和位姿,同时利用光流和循环神经网络以及生成对抗网络改进深度和位姿的估计精度。
Sep, 2023
该文章介绍了一种名为 DeepVIO 的自监督深度学习网络,通过直接合并 2D 光流特征(OFF)和惯性测量单元(IMU)数据,提供绝对轨迹估计,实验结果表明其在准确性和数据可适应性方面优于传统的基于 Deep-Learning 方法。
Jun, 2019
通过分析主要的失败案例并揭示优化过程的各种缺点,我们诊断了一种流行的学习型 SLAM 模型(DROID-SLAM)的关键弱点。然后,我们提出使用自监督先验,利用冻结的大规模预训练单眼深度估计初始化稠密捆绑调整过程,从而实现鲁棒的视觉里程计,无需对 SLAM 骨干进行微调。尽管方法简单,但在 KITTI 里程计和具有挑战性的 DDAD 基准上,我们的方法显示出显著的改进。代码和预训练模型将在发表后发布。
Jun, 2024
介绍了一种联合训练 3D 目标检测和单目稠密深度重建神经网络的方法,通过 LiDAR 点云和单个 RGB 图像生成物体姿态预测和密集重建深度,其中 LiDAR 点云被转换为一组体素并使用 3D 卷积层提取特征,通过另一个 2D 卷积神经网络提取相应的 RGB 图像特征,并使用这些组合特征来预测密集深度图。
Apr, 2021
提出一个新的单目视觉里程计框架 D3VO,它利用三个层次的深度网络 —— 深度、姿态和不确定性估计,并使用自监督单目深度估计网络训练了预测亮度变换参数,提高了深度估计精度和提供了学习到的光度残差加权函数,进而实现前端跟踪和后端非线性优化。在 KITTI 里程测量基准和 EuRoC MAV 数据集上测试表明,D3VO 在单目视觉里程计方面的表现优于传统方法和其他最先进的 VO 方法,同时仅使用一个相机就可以实现与最先进的立体 / LiDAR 里程测量和最先进的视觉惯性里程测量相媲美的结果。
Mar, 2020
本研究提出了一种新的基于卷积神经网络的多任务全局姿态矫正和里程计评估方法 VLocNet,该模型结构紧凑、可实现实时推断,并采用了一种新颖的辅助损失函数来利用相关位姿信息进行训练,在室内和户外数据集上的实验结果表明,该模型具有可与 SIFT 算法媲美、甚至优于其表现的定位精度。
Mar, 2018
利用激光雷达传感器获取的稀疏但准确的深度测量,设计了一个自监督视觉 - 激光雷达里程计 (Self-VLO) 框架,该框架通过两个路径编码器提取视觉和深度图像中的特征,并将这些特征与多尺度解码器中的特征通过融合模块融合起来,从而在端到端学习的方式下产生姿态和深度估计。实验结果表明,该方法优于所有自监督视觉或激光雷达里程计,并且优于全监督视觉里程表,证明了融合的强大表现能力。
Jan, 2021
本文提出了一种新颖的单目视觉里程计(VO)系统 UnDeepVO,其能够使用深度神经网络估计单目相机的 6-DoF 姿态和视野深度,该系统具有无监督深度学习方案和绝对尺度恢复两个显着特点,并且在 KITTI 数据集上获得了良好的姿态精度。
Sep, 2017