With the success of deep learning based approaches in tackling challenging
problems in computer vision, a wide range of deep architectures have recently
been proposed for the task of visual odometry (VO) estimati
自监督学习 VO 的一种特殊考虑一致性的方法,采用具有两层卷积 LSTM 模块的姿态网络对姿态预测中的长期依赖进行建模,通过自监督损失进行训练,包括模拟几何 VO 中的循环一致性丢失的循环一致性丢失,并通过引入一种损失使网络能够在训练期间超出小时间窗口。结果表明,在几个 VO 数据集中表现出竞争性结果,包括 KITTI 和 TUM RGB-D。
通过分析主要的失败案例并揭示优化过程的各种缺点,我们诊断了一种流行的学习型 SLAM 模型(DROID-SLAM)的关键弱点。然后,我们提出使用自监督先验,利用冻结的大规模预训练单眼深度估计初始化稠密捆绑调整过程,从而实现鲁棒的视觉里程计,无需对 SLAM 骨干进行微调。尽管方法简单,但在 KITTI 里程计和具有挑战性的 DDAD 基准上,我们的方法显示出显著的改进。代码和预训练模型将在发表后发布。