Mar, 2024

JIST:序列视觉地点识别的联合图像和序列训练

TL;DR通过利用 JIST 和 SeqGeM 提出的多任务学习框架和序列嵌入池化方法,本研究旨在通过视觉线索识别之前访问过的地点,以解决标记数据获取困难的问题,并在速度、嵌入大小、架构轻量化和处理多长度序列等方面优于现有技术。