Mar, 2024

SceneGraphLoc: 跨模态粗略基于 3D 场景图的视觉定位

TL;DR这篇论文介绍了一个新问题,即在由 3D 场景图数据库表示的多模式参考地图中定位输入图像。通过学习场景图中每个节点的固定大小嵌入,该方法提供了一种轻量级且高效的替代方法,以有效地匹配输入查询图像中可见的对象实例,实现了超出其他跨模态方法的性能表现,并在使用图像时实现了与大型图像数据库依赖的最先进技术相当的性能,同时存储效率提高了三个数量级并且运行速度加快了几个数量级。