DeepFactors:实时概率稠密单目 SLAM
本文在单目 SLAM 框架中嵌入了实时深度学习的目标检测器,将普通物体表示为四面体,进一步细化物体重建,检测附加平面标志并建模为独立地标志,可大幅提高系统的定位性能和语义地图的丰富程度。
Sep, 2018
本论文将最新的深度学习方法与基于视频流的半稠密 SLAM 相结合,在室内 / 室外数据集中得到了更好的 2D 语义标签识别,无需针对序列中的每一帧获得语义分割,其时间复杂度也得以合理控制。
Nov, 2016
提出了一种新的基于几何和光学的三维地图制图方法,利用稠密单目 SLAM 和实时分层体积神经辐射场技术,通过提供估计准确的位姿和深度图的相关不确定性,实时适应神经辐射场的场景。通过采用提出的基于不确定性的深度损失,实现了良好光学和几何精度,在实时和单目成像的情况下比竞争方法更精确 (最高提高 179% 的 PSNR 和 86% 的 L1 深度)。
Oct, 2022
本文介绍了 Photo-SLAM,一种具有超级基元地图的创新 SLAM 框架,通过同时利用显式几何特征进行定位和学习隐式光度特征来表示观察环境的纹理信息,以及采用高斯金字塔训练方法逐步学习多级特征以增强逼真的映射性能。实验证明,与当前最先进的 SLAM 系统相比,我们提出的 Photo-SLAM 在线逼真映射的性能显著优于其他系统,如 Replica 数据集中的 PSNR 提高了 30%,渲染速度快了数百倍。此外,Photo-SLAM 可以在像 Jetson AGX Orin 这样的嵌入式平台上实时运行,展示了机器人应用的潜力。
Nov, 2023
本文研究了如何利用卷积神经网络深度预测图来进行准确而密集的单目重建,并提出了一种将 CNN 预测的密集深度图与直接单目 SLAM 测量所获得的深度测量自然融合的方法,证明了这种方法在场景重建绝对尺度估计等方面的鲁棒性和准确性。最终,提出了一个将语义标签与单个帧的密集 SLAM 高效融合的框架,能够从单个视图中获得语义一致的场景重建。
Apr, 2017
MoD-SLAM 是一种基于神经网络的单目稠密建图方法,通过使用单目深度估计来优化场景重建,并利用闭环检测来更新相机姿态,实现实时在无边界场景中进行全局姿态优化和三维重建。与以往神经网络建图方法相比,我们的方法更加稳健、可扩展和多功能,在大型无边界场景中表现出更卓越的建图性能。
Feb, 2024
基于神经场的实时单目建图框架与密集 SLAM 相结合,利用多分辨率网格编码和有符号距离函数表征进行神经场的高效构建,并通过环路闭合和深度先验进行全局一致性和精度增强,从而优于现有方法,在保持实时性能的同时提高了准确度和地图完整性。
Oct, 2023
GO-SLAM 是一种基于深度学习的稠密视觉 SLAM 框架,通过全局优化姿态和三维重建实时改进相机跟踪和重构方面的错误累积问题,并通过有效的闭环检测和在线全捆绑调整支持鲁棒的姿态估计和实时三维重建,同时在运行中实时更新隐式和连续的表面表示以确保全局一致性的三维重建,各种合成和真实世界数据集的结果表明,GO-SLAM 在跟踪鲁棒性和重建精度方面优于现有方法,并且具有多样性,可配合单目、立体和 RGB-D 输入工作。
Sep, 2023
本文提出了一种基于密集神经算法的同步定位与建图方法,使用深度学习生成的点云来锚定神经场景的特征,通过最小化基于 RGBD 的重新渲染损失,实现对跟踪和地图绘制的同时处理,通过在信息密度低的区域减少运行时间和内存使用,并将更高的点密度分配给解决更细节问题。在 Replica,TUM-RGBD 和 ScanNet 数据集上相对于现有的神经 RGBD SLAM 方法获得了更好或相似的跟踪,地图和渲染准确性。
Apr, 2023