- 基于四次曲面级别物体映射的三维拓扑图的语义闭环检测
通过多级验证的对象级数据关联方法和基于二次曲面对象地图拓扑结构的语义闭环方法,我们将其整合到一个完整的对象感知 SLAM 系统中,并在定性实验和定量实验中验证了其有效性、稳健性以及在精度、召回率和定位精度等度量指标上优于现有方法。
- PACE:野外视频中人体和摄像机运动的估计
通过结合人体运动先验知识和场景特征,提出了一种估计全局场景下人体运动的联合优化框架,该方法在人体和相机运动估计方面相较于现有方法有显著的改进。
- 通过推理高层次的语义关系概念改进情境图
本文介绍了如何使用图神经网络来学习从低级因子图中推断出的高级语义关系概念,提出了一个可以更准确、更高效地推断房间实体及其与映射墙面的关系的方法,同时演示了如何引入墙面的语义概念及其与墙面的关系。该方法已经集成到 S-Graphs + 中,并 - 快速准确的深度闭环和可靠的激光雷达定位与建图
该研究聚焦于解决姿态估计漂移和退化问题,提出了一种名为 LCR-Net 的多头网络模型,通过新颖的特征提取和姿态感知机制来准确估计 LiDAR 扫描之间的相似度和 6-DoF 姿态,将其应用于室外驾驶环境中,实现了强大而准确的在线 LiDA - 无运动偏差的特征基 SLAM
通过在四个数据集上进行综合评估,我们展示了我们在 ORB-SLAM2 中实施的多项贡献大大减少了前进和后退运动之间的偏差,并且进一步改善了汇总的轨迹误差,消除 SLAM 运动偏差对于广泛的机器人和计算机视觉应用的性能一致性非常重要。
- 机器人定位与建图终稿 —— 用于自监督式深度视觉测距的顺序对抗学习
使用深度神经网络进行图像生成任务以提取高级特征,进而估计视觉里程碑的深度和位姿,同时利用光流和循环神经网络以及生成对抗网络改进深度和位姿的估计精度。
- 深度学习在视觉定位和地图构建中的应用综述
通过综述和提出分类法,本文基于深度学习对定位和制图的研究方法进行探讨,并希望成为将来研究人员应用深度学习解决视觉定位和制图问题的指南。
- 基于几何特征的紧耦合激光雷达 - 视觉 SLAM 移动代理方案
本研究针对移动机器人在动态和复杂环境下自主导航和任务执行的困难,提出了一种基于 LiDAR 和单目视觉 SLAM 的紧耦合几何特征融合框架方法,是当前多模态方法中姿态估计更为精确和健壮的。
- 锁定:利用动态车辆约束来改善视觉定位
该研究提出一种使用动态车辆提供有限位姿约束信息的 6-DoF 逐帧 PnP-RANSAC 定位管道方法,可改善单图像 PnP 方法和其基准位姿过滤的记忆率,并在车辆移动被相对帧 - 帧位置约束的情况下触发计算未来位姿估计质量的方法。
- iSLAM:命令式 SLAM
本研究提出了一种新的自我监督的 SLAM(iSLAM)框架,通过前后端之间的互补纠正,大幅提高了系统的泛化能力,实现了高达 45% 的精度提升。这是第一个自我监督的 SLAM 系统,表明前端和后端可以共同学习,在不需要外部监督的情况下相互促 - FEDORA: 活动飞行数据集用于反应行为
该研究介绍了使用事件驱动硬件在资源受限环境下实现复杂视觉任务的方法,提出了 FEDORA 数据集作为第一个提供深度、姿态、自我运动和光学流数据的全合成数据集,可以用于自主导航和障碍物规避的多个相关任务。
- 单目尺度校正与运动补偿的视觉 - LiDAR 里程计与建图
该论文提出一种新颖的视觉 - LiDAR 里程计和建图方法,该方法基于 ORB-SLAM 和 A-LOAM 两种常用方法,并采用单目尺度校正和视觉辅助 LiDAR 运动补偿修改,其显著优于 ORB-SLAM2 和 A-LOAM,而其视觉里程 - 动态环境下的实时 SLAM 管道
本文提出了一个新的实时 SLAM 流水线,使用 RGB-D SLAM 和 YOLO 实时物体检测来分割和去除动态场景,并构建静态场景 3D 模型。
- 一种基于事件的算法,用于同时跟踪和绘制 6 自由度相机姿态
本文介绍了使用适应性选择事件窗口中的信息形成运动补偿图像来重建场景以及估计相机的 6-DOF 姿态,并提出了一个惯性版本的仅事件流水线,以评估其性能。通过对两个公开事件数据集的序列的不同配置的结果与基准进行比较,本文证明了所提出的事件惯性流 - CVPR通过自我头部姿态估计进行自我身体姿态估计
该研究介绍了一种新方法,利用头部运动作为中间表示,将三维人体运动的预测分解为两个阶段,并使用条件扩散生成多个可能的全身动作,消除了需要训练配对数据集的需求,可以分别利用大规模的追踪数据集和运动捕捉数据集。
- 基于视觉的 SLAM 综述:从几何建模到基于学习的语义场景理解
本文回顾了 Visual-SLAM 领域中采用基于深度学习等基于数据驱动的方法来解决传统基于几何模型的技术在复杂环境中难以处理的 SLAM 问题的最新进展,并探讨了其面临的挑战和发展机遇。
- CVPR面向对称性和不确定性的 6 自由度物体位姿估计 SLAM
提出了基于关键点的对象级 SLAM 框架,能够为对称和非对称对象提供全局一致的 6DoF 姿态估计。通过利用来自 SLAM 的相机姿态信息,提供对对称对象上跟踪关键点的 先验知识 -- 确保新的测量结果与当前 3D 场景一致。实验表明,该方 - GeoRefine:用于精确密集地图的自监督在线深度细化
GeoRefine 是一种深度细化系统,用于几何一致的稠密映射,包含三个模块:SLAM 模块,在线深度细化模块和全局映射模块。系统设计严谨,通过使用基于学习的先验知识的混合 SLAM 模块、自监督损失和避免在线深度细化退化情况的精心系统设计 - 使用脚底 IMU 和局部磁场的室内 SLAM
本文提出了一种利用 RBPF 粒子滤波算法和 IMU 惯性测量单元跟踪行人运动的同时定位和建图方法,使用了一些地图来纠正行人的位置信息和方向估计值,实验证明其在室内环境中定位和跟踪行人的有效性。
- 一种在线语义映射系统,用于扩展与增强视觉 SLAM
本文提出了一种移动视觉系统的实时语义地图构建方法,采用 2D 到 3D 对象检测流程和快速数据关联,将关联检测作为语义约束引入 SLAM 系统进行姿态校正,通过本文提出的观测对象局部关联处理和基于不确定性贪心关联的方案,平均迭代时间达到了