学习视觉外观的动态地图
利用最相关的视觉记忆来定位或者事先预测定位的可能结果对于高效和稳健的视觉导航非常有用。我们提出了一种高度可扩展的工具 Visual DNA,用于比较图像数据集,鉴于本文中的深度架构在特定层面上通过匹配特征体积进行地点识别,我们使用分布度量来比较活体图像和多个先前记录的过往经验之间神经元激活统计的差异,发现这些差异与使用具有相同外观差距的过去经验进行定位的性能相关。我们验证了我们的方法在 Nordland 跨季节数据集以及牛津大学公园的数据中,展示了我们系统在候选经验的实际定位性能排序方面的出色能力。
Oct, 2023
自动将古代图片与现代图片关联并创建文化遗产城市地图的任务,本文介绍了如何通过在因互联网引起的时间差异下变化较大的现代标注图像中识别古代照片中的位置,并对不同的特征进行了广泛分析。此外,我们还展示了本任务可以从域自适应中受益。
Sep, 2014
视觉地理定位方法的多阶段课程学习以及全局和局部特征的关键点检测、描述和位置调整使其成为一种实用的视觉地理定位解决方案,取得了高召回率的好成绩。
Nov, 2023
本研究提出一种用于预测对象视觉属性的大规模数据集,通过多标签分类解决对象属性预测问题,并采用多种技术来解决大量属性、标签稀疏性、数据不平衡和对象遮挡等问题,其中包括使用低级和高级 CNN 特征、多跳关注、重新加权和重新抽样技术、负标签扩展和监督属性感知对比学习算法,并取得了超过现有技术水平的 3.7 mAP 和 5.7 F1 值的改进。
Jun, 2021
本研究旨在通过多尺度注意力模块,实现从视觉和语义内容中学习鲁棒全局嵌入以及动态引导的分割过程,以提高视觉地点识别的准确性,同时提出第一个适用于地点识别和分割任务的合成世界数据集,实验证明方法在不同情景下具有良好性能。
Jan, 2022
我们提出了一种基于 Transformer 的端到端架构,通过层次交叉注意力利用不同地理层次和相应的视觉场景信息来确定照片的确切纬度和经度,实现了在四个标准地理位置数据集上的最新成果,并介绍了一个更困难的测试数据集,从 Google Streetview 中覆盖整个地球,并呈现出最新的结果。
Mar, 2023
本文提出一种基于多任务架构的视觉定位方法,通过将几何和语义信息融合到多尺度的嵌入表示中,使用有效的多尺度特征鉴别器进行对抗性训练,从虚拟数据集到现实世界数据集的领域适应,以实现图像检索定位及大规模地点识别。该方法在 Extended CMU-Seasons 数据集和 Oxford RobotCar 数据集上进行验证,结果表明本方法在具有挑战性的环境下的检索定位和大规模地点识别的表现优于现有方法。
Oct, 2020
本文通过追踪可穿戴相机拍摄的随机行人脸部特征,结合地理位置与天气信息,建立了适用于人脸属性分类的特征表示方法,并在多种数据集上实现了远超同类方法的准确率。
Apr, 2016