CVPRMay, 2024

BoQ:一个地方值得一袋可学习的查询

TL;DR在视觉地点识别中,通过引入一种名为查询包(BoQ)的新技术,该技术学习一组全局查询来捕捉普遍的地点特征,并利用交叉注意力实现一致的信息聚合。BoQ 通过与 CNN 和 Vision Transformer 骨干网络集成,并通过对 14 个大规模基准进行广泛实验表明了卓越的性能。同时,作为一种全局检索技术(一阶段),BoQ 在速度和效率上超过了 Patch-NetVLAD、TransVPR 和 R2Former 等两阶段检索方法。