JIST：序列视觉地点识别的联合图像和序列训练

Mar, 2024

JIST：序列视觉地点识别的联合图像和序列训练

JIST: Joint Image and Sequence Training for Sequential Visual Place Recognition

Gabriele Berton, Gabriele Trivigno, Barbara Caputo, Carlo Masone

TL;DR通过利用 JIST 和 SeqGeM 提出的多任务学习框架和序列嵌入池化方法，本研究旨在通过视觉线索识别之前访问过的地点，以解决标记数据获取困难的问题，并在速度、嵌入大小、架构轻量化和处理多长度序列等方面优于现有技术。

Abstract

visual place recognition aims at recognizing previously visited places by relying on visual clues, and it is used in robotics applications for slam and localization. Since typically a mobile robot has access to a

visual place recognition sequence-to-sequence localization jist seqgem slam

发现论文，激发创造

SeqNet: 基于序列的分层地点识别描述符学习

本文提出一种新型混合系统，使用 SeqNet 生成临时描述符，并结合单图片学习描述符进行选择性控制序列得分汇总，以创建高性能初始匹配假设生成器，进而在挑战性基准数据集上达到超越现有最先进方法的效果。

Feb, 2021

多进程融合：使用多种图像处理方法进行视觉地点识别

该论文提出了一种多传感器融合、动态匹配序列长度技术和自动处理方法权重方案相结合的新颖的图像处理方法，在识别质量度量分析的基础上，提高了定位的性能要求，实现了优于两种最先进的视觉地点识别系统的结果。

Mar, 2019

SeqNetVLAD vs PointNetVLAD: 白天黑夜场所识别中的图像序列与三维点云

比较三维点云方法和基于图像序列的方法在场所识别性能上的差异，结果表明对于特定度量跨度，基于图像序列的技术可以接近甚至超过基于点云的方法的表现。

Jun, 2021

条件不变的多视角地点识别

本文使用深度神经网络，并提出 3 种不同的方法，即描述符组合、融合和循环描述符，探讨如何利用时间序列信息来改善视觉地点识别的困难。研究结果表明，在两个公共数据库中，我们的方法比单视角和多视角基线产生更简洁且一致的描述符，进而改善了视觉地点识别的准确性。

Feb, 2019

端到端可训练的基于图像序列识别的神经网络及其在场景文本识别中的应用

本文提出了一种新颖的神经网络架构，将特征提取、序列建模和转录集成到统一框架中，用于场景文本识别，相比现有算法其具有端到端训练，不需要一定的词典限制，更加适合实际应用等优点，在标准测试数据上展现出更好的性能。

Jul, 2015

基于时空注意力的序列描述符学习用于视觉地点识别

本文提出了一种序列化描述符提取方法，以有效地融合时空信息并生成有区别的描述符，使用滑动窗口来控制时间自我关注范围，并采用相对位置编码来构建不同特征之间的位置关系，从而捕捉帧序列中的固有动态和局部特征运动。

May, 2023

基于序列匹配过载表征的快速、紧凑且高度可扩展的视觉地点识别

本研究提出了一种新的机器人空间数据可视化算法，实现了超紧凑的空间表示，接近次线性存储缩放和极轻量计算需求，并将散列过载方法应用于过程中，使得在匹配 100 帧序列时，每个空间定位点仅需 8 字节存储和 37k 个单元操作即可达到超过 50％的检索率

Jan, 2020

多技术顺序信息一致性在变化环境中的动态视觉地点识别

多顺序信息一致性 (多音乐) 是一个利用顺序信息在在线每帧基础上选择最具连贯性技术的 VPR 系统，通过分析各技术的前几个匹配候选的帧间连续性，然后直接进行比较选择当前查询图像的最佳技术，该系统在不同基准数据集上提高了整体 VPR 性能，避免了对运行时环境的额外准确场景。

Jan, 2024

DASGIL: 面向语义和几何感知的基于图像的领域自适应定位

本文提出一种基于多任务架构的视觉定位方法，通过将几何和语义信息融合到多尺度的嵌入表示中，使用有效的多尺度特征鉴别器进行对抗性训练，从虚拟数据集到现实世界数据集的领域适应，以实现图像检索定位及大规模地点识别。该方法在 Extended CMU-Seasons 数据集和 Oxford RobotCar 数据集上进行验证，结果表明本方法在具有挑战性的环境下的检索定位和大规模地点识别的表现优于现有方法。

Oct, 2020

基于 Spatio-Semantic ConvNet 的视觉地点识别

该研究提出了一种采用卷积神经网络（VGG16）的激活层对地点图像进行编码的视觉地点识别系统。该系统采用了类似于图像检索流程的两阶段方法，并在第二阶段使用 CNN 特征来编码语义和空间信息，其效果在常见基准数据集上明显优于其他方法。

Sep, 2019