GCNv2:实时 SLAM 的高效对应预测
本论文介绍了一种名为 DGC-GNN 的新算法,它采用全局到局部的图神经网络来逐步利用几何和颜色线索来表示关键点,从而提高匹配的鲁棒性。DGC-GNN 不仅使无描述符算法的精度翻倍,而且还显著缩小了基于描述符和无描述符方法之间的性能差距。
Jun, 2023
本文提出了一种新颖的 6D 物体姿态估计框架,称为 G2L-Net,它可以通过 RGB-D 检测处理点云数据来进行实时姿态估计,并在两个基准数据集上取得了最先进的性能。
Mar, 2020
本文提出了一种深度学习框架,用于准确的视觉对应,并证明了其在几何和语义匹配中的有效性,提出了一种卷积空间变换器来模仿传统特征(如 SIFT)中的补丁归一化,广泛的 KITTI,PASCAL 和 CUB-2011 数据集的实验表明,与使用手工构建或学习特征的先前作品相比,我们的特征具有显着优势。
Jun, 2016
提出了 PointRGCN—— 一种基于图卷积网络(GCN)的图形三维物体检测管道,该管道专门用于对三维 LiDAR 点云进行操作,包含 R-GCN 和 C-GCN 的残差 GCNs 的集成,使用图形表示对三维物体提议进行了改进,并在 bird eye 视图检测任务的简单难度上实现了最先进的性能。
Nov, 2019
在动态环境中,通过引入掩蔽预测机制,该论文提出了一种用于实现实时性能的动态环境下的视觉 SLAM 系统,该系统通过将深度学习方法和相机跟踪以不同的频率完全并行运行,从而在 CPU 上实现了实时性能。此外,它还介绍了双阶段光流跟踪方法,并结合光流和 ORB 特征的混合应用,显著提高了系统的效率和鲁棒性。与最先进的方法相比,该系统在动态环境中保持高定位精度的同时,在单个笔记本电脑 CPU 上实现了 56 帧每秒的跟踪帧率,而无需任何硬件加速,从而证明了即使没有 GPU 支持,深度学习方法在动态 SLAM 中仍然可行。根据已有的信息,这是第一个实现此功能的 SLAM 系统。
May, 2024
本研究针对两幅图像之间密集像素对应估计的挑战进行探讨,提出了一种基于粗到细的 CNN 框架,能够扩展光流方法的优势,解决大范围变换并提供密集和亚像素准确估计的问题,并在相对摄像机姿态估计问题上表现优异。
Oct, 2018
本文介绍了一种基于迭代图滤波的框架,用于 3D 人体姿势估计,并通过高斯 - 塞德尔迭代法设计了 Gauss-Seidel 网络架构,利用邻接修正和跳跃连接等方法改善模型性能。实验结果表明,该方法在两个标准数据集上都超过了其他基准方法,达到了最先进性能。
Jul, 2023
本文提出了并行化技术,为图采样 GCN 提供卓越的可扩展性性能,在不妥协准确性的情况下,在非常大的图上实现了优秀的性能。具体地,我们保证了 GCN 的高效训练,并在计算和通信方面节约了数量级的开销,同时,我们的并行图嵌入在可扩展性、效率和准确性方面优于现有的方法。
Oct, 2018
本文提出了一种使用卷积神经网络在像素级别取得可靠对应的方法,该模型可以同时作为密集特征描述符和特征检测器,并且在后期检测可以获得比传统低级结构的更稳定的关键点,从而实现了在无法获取更多注释信息的情况下训练该模型,该方法可以在难以定位的数据集(Aachen Day-Night localization dataset)和室内定位测试基准(InLoc indoor localization benchmark)中获得最先进的表现,同时在其他图像匹配和 3D 重建基准测试中也有竞争力。
May, 2019
ORB-SLAM2 是一个用于单目、双目以及 RGB-D 相机的完整的 SLAM 系统,包括地图重用、回环闭合和重定位能力,利用纯视觉观测、双目视觉观测和 RGB-D 相机,在各种环境下都能实时工作。其基于捆绑调整的后端可以在实现度规尺度精确的同时实现高精度的轨迹估计。通过在 29 个流行的公共数据集上的评估,证明 ORB-SLAM2 的精度达到了最新的最佳结果,因此我们将其开源以便于 SLAM 社区以及其他领域的研究人员使用。
Oct, 2016