学习视觉外观的动态地图

CVPRDec, 2020

Learning a Dynamic Map of Visual Appearance

Tawfiq Salem, Scott Workman, Nathan Jacobs

TL;DR使用每天拍摄的、带时间和地理位置数据的数十亿张影像，通过一个不需要人工标注的框架，构建了一个全球范围内的、动态的、可细粒度理解时空下视觉特征的地图，支持基于影像的地图创建、影像地理位置确认和元数据验证等多种应用。

Abstract

The appearance of the world varies dramatically not only from place to place but also from hour to hour and month to month. Every day billions of images capture this complex relationship, many of which are associated with precise time and location metadata. We propose to use these imag

visual appearance global-scale map dynamic geographic location metadata

发现论文，激发创造

学习将几乎任何事物映射

通过交叉模态蒸馏策略，从俯瞰图像中学习预测细粒度地物属性的分布，以实现精细化的土地覆盖估计，结果可应用于地图绘制和图像定位。

Sep, 2019

世界功能地图

介绍了一个新的数据集，称为 “世界功能地图（fMoW）”，旨在激发机器学习模型的开发，从卫星图像的时间序列和丰富的元数据特征中预测建筑物和土地用途的功能目的。

Nov, 2017

你所见即你所得：使用深度神经网络的经验排名进行拓扑定位的数据集对比相似度

利用最相关的视觉记忆来定位或者事先预测定位的可能结果对于高效和稳健的视觉导航非常有用。我们提出了一种高度可扩展的工具 Visual DNA，用于比较图像数据集，鉴于本文中的深度架构在特定层面上通过匹配特征体积进行地点识别，我们使用分布度量来比较活体图像和多个先前记录的过往经验之间神经元激活统计的差异，发现这些差异与使用具有相同外观差距的过去经验进行定位的性能相关。我们验证了我们的方法在 Nordland 跨季节数据集以及牛津大学公园的数据中，展示了我们系统在候选经验的实际定位性能排序方面的出色能力。

Oct, 2023

大时间滞后地点识别

自动将古代图片与现代图片关联并创建文化遗产城市地图的任务，本文介绍了如何通过在因互联网引起的时间差异下变化较大的现代标注图像中识别古代照片中的位置，并对不同的特征进行了广泛分析。此外，我们还展示了本任务可以从域自适应中受益。

Sep, 2014

CurriculumLoc: 通过多阶段改进增强跨领域地理定位

视觉地理定位方法的多阶段课程学习以及全局和局部特征的关键点检测、描述和位置调整使其成为一种实用的视觉地理定位解决方案，取得了高召回率的好成绩。

Nov, 2023

野外视觉属性预测学习

本研究提出一种用于预测对象视觉属性的大规模数据集，通过多标签分类解决对象属性预测问题，并采用多种技术来解决大量属性、标签稀疏性、数据不平衡和对象遮挡等问题，其中包括使用低级和高级 CNN 特征、多跳关注、重新加权和重新抽样技术、负标签扩展和监督属性感知对比学习算法，并取得了超过现有技术水平的 3.7 mAP 和 5.7 F1 值的改进。

Jun, 2021

多尺度注意力学习视觉地点识别语义

本研究旨在通过多尺度注意力模块，实现从视觉和语义内容中学习鲁棒全局嵌入以及动态引导的分割过程，以提高视觉地点识别的准确性，同时提出第一个适用于地点识别和分割任务的合成世界数据集，实验证明方法在不同情景下具有良好性能。

Jan, 2022

使用层次和场景的基于查询的全球图像地理定位

我们提出了一种基于 Transformer 的端到端架构，通过层次交叉注意力利用不同地理层次和相应的视觉场景信息来确定照片的确切纬度和经度，实现了在四个标准地理位置数据集上的最新成果，并介绍了一个更困难的测试数据集，从 Google Streetview 中覆盖整个地球，并呈现出最新的结果。

Mar, 2023

DASGIL: 面向语义和几何感知的基于图像的领域自适应定位

本文提出一种基于多任务架构的视觉定位方法，通过将几何和语义信息融合到多尺度的嵌入表示中，使用有效的多尺度特征鉴别器进行对抗性训练，从虚拟数据集到现实世界数据集的领域适应，以实现图像检索定位及大规模地点识别。该方法在 Extended CMU-Seasons 数据集和 Oxford RobotCar 数据集上进行验证，结果表明本方法在具有挑战性的环境下的检索定位和大规模地点识别的表现优于现有方法。

Oct, 2020

行走学习：基于自我为中心视频和上下文数据的面部属性表示学习

本文通过追踪可穿戴相机拍摄的随机行人脸部特征，结合地理位置与天气信息，建立了适用于人脸属性分类的特征表示方法，并在多种数据集上实现了远超同类方法的准确率。

Apr, 2016