基于图论对应匹配的单次全局定位
通过使用多模态数据关联方法,结合基于对象的地图和相机图像,本文描述了一种全局定位的方法。我们尝试使用 Vision Language Model (VLM),通过自然语言描述标记地标,并基于图像观察的概念相似性提取对应关系,从而提高了全局定位的准确性和效率。
Feb, 2024
这篇论文介绍了一个新问题,即在由 3D 场景图数据库表示的多模式参考地图中定位输入图像。通过学习场景图中每个节点的固定大小嵌入,该方法提供了一种轻量级且高效的替代方法,以有效地匹配输入查询图像中可见的对象实例,实现了超出其他跨模态方法的性能表现,并在使用图像时实现了与大型图像数据库依赖的最先进技术相当的性能,同时存储效率提高了三个数量级并且运行速度加快了几个数量级。
Mar, 2024
本文将点云配准问题视为语义实例匹配和配准任务,提出了一种用于大规模室外点云配准的深度语义图匹配方法。通过利用大规模点云语义分割网络获得 3D 点云的语义类别标签,并使用欧氏聚类算法将具有相同类别标签的相邻点进行聚类。基于语义实例的空间相邻关系构建了语义邻接图,通过图卷积网络学习了几种高维特征,包括几何形状特征、语义分类特征和空间分布特征,同时应用了注意力机制进行增强。将语义实例匹配问题建模为一个最优传输问题,并通过最优匹配层进行求解。最后,根据匹配的语义实例,首先通过奇异值分解(SVD)算法获得两个点云之间的几何变换矩阵,然后使用 ICP 算法进行细化处理。实验在 KITTI Odometry 数据集上进行,所提出方法的平均相对平移误差和平均相对旋转误差分别为 6.6cm 和 0.229 度。
Aug, 2023
该论文提出了一种统一框架,名为 GraphLoG,用于自监督整图表示学习,其除保留本地相似性外,还引入了分层原型来捕捉全局语义簇,进一步发展了一个高效的在线期望最大化算法来学习该模型,并在化学和生物基准数据集上进行了广泛实验,证明所提出的方法的有效性。
Jun, 2021
该论文提出了一种解决全局定位问题的方法,通过使用基于 Siamese LocNets 的半手工表示学习方法,在全局先验地图中实现了场所识别和尺度姿态估计,并且提出了一个使用仅距离观测的全局定位框架。通过 KITTI 数据集和自主收集的多个数据集的实验结果表明,该系统能够实现高精度的全局定位。
Dec, 2017
本文提出了一种基于结构和图像的语义匹配方法,能够在诸如季节、亮度、天气和昼夜变化等多种条件下实现准确和稳健的视觉定位,实验证明该方法相较于现有技术有显著的提升。
Apr, 2019
本文提出 GoMatch 作为大规模本地化中仅基于几何信息匹配图像关键点到地图的替代方案,使用 3D 点的旋转矢量表示地图,减少了存储需求并提高了实时性。实验表明,与最佳视觉匹配方法相比,GoMatch 在 Cambridge Landmarks 和 7-Scenes 上的平均姿态中位误差分别降低了 (10.67 米,95.7 度) 和 (1.43 米,34.7 度),并且只需最佳视觉匹配方法存储能力的 1.5/1.7%。
Mar, 2022
本文提出一种新的学习可伸缩图匹配方法,用于解决目前多目标跟踪(MOT)任务中的数据关联问题,该方法可以使跟踪器在面对严重遮挡等困难情况时表现更加优异,同时在多项标准 MOT 数据集上取得了最先进的性能。
Mar, 2021
本文研究基于图像的地理定位问题,通过在地图上确定地面视角的查询图像。我们提出了一种新的方法,通过 2.5D 空间中的结构高度来引导跨视图匹配,并借助多模态数据学习代表性嵌入。我们构建了第一个大规模的地面到 2.5D 地图地理定位数据集来验证我们的方法,并在单图像定位和路径定位等任务上进行了广泛实验,结果表明我们的方法在定位精度和收敛速度上明显优于之前的基于 2D 地图的方法。
Aug, 2023
本文介绍了一种使用图神经网络模型建模三维稠密地图为异构图并预测三维点重要性得分的方法,以选取具有未来重定位价值和稀疏地图覆盖的点。该方法在自适应环境中提取出稳定和广泛可见的地图点,并在定位性能方面优于基线模型。
Mar, 2022