CVPRApr, 2022

大规模应用中的视觉地理定位再思考

TL;DR在这篇论文中,我们构建了一个 30 倍于现有最大数据集的 San Francisco eXtra Large 数据集,研究了现有的技术在实际城市范围内的视觉定位应用中的性能表现,并设计了一种高度可扩展的训练技术 CosPlace,它将训练模型作为分类问题,避免了常用对比学习的昂贵挖掘技术,这种技术在多个数据集上均能实现最先进的表现,并且相对于现有技术,它需要的 GPU 内存减少了约 80%,且在描述符更小的情况下取得更好的结果。