Nov, 2023

视觉地点识别的最优输运聚合

TL;DR通过 SALAD 方法,利用 DINOv2 作为 backbone,优化了视觉地点识别任务,提高了描述符的质量,并在公共 VPR 数据集中超越了单阶段和双阶段方法。