弥合地对空图像匹配的领域差距

ICCVApr, 2019

Bridging the Domain Gap for Ground-to-Aerial Image Matching

Krishna Regmi, Mubarak Shah

TL;DR本研究提出了一种基于条件 GAN 的新方法，通过合成俯视图像，将两个视图之间的差距最小化，实现了对视觉实体的跨视图建模并进行特征融合，最终在 CVUSA 数据集上成功实现了景点检索任务。

Abstract

The visual entities in cross-view images exhibit drastic domain changes due to the difference in viewpoints each set of images is captured from. Existing state-of-the-art methods address the problem by learning view-invariant descriptors for the images. We propose a novel method for so

cross-view view-invariant descriptors conditional gans feature fusion multi-scale feature aggregation

发现论文，激发创造

基于几何引导的条件生成对抗网络的跨视角图像合成

本文提出了基于几何约束的跨视图图像合成方法，该方法包含使用单应性矩阵将图像映射到另一个视图，利用生成式对抗网络对转换后的图像进行缺失区域修复，实现更为逼真的图像合成效果。

Aug, 2018

利用航空参考图像进行广域图像地理定位

本文旨在使用卷积神经网络来解决跨视角图像地理定位的问题，并介绍了用于地面图像和航拍图像的特征表示，并提出一种融合多个空间尺度提取的特征的网络架构，并通过实验表明其比现有方法更为优越。

Oct, 2015

交叉视角图像地理定位的最优特征传输

本文提出一种新的交叉视图特征传输（CVFT）技术来明确建立跨视图传输，从而促进地面图像和航空图像之间的功能对齐，实现更有意义的特征相似度比较，明显提高了交叉视图定位性能，预计该领域差异处理的关键洞察将证明在计算机视觉领域中也很有用。

Jul, 2019

语义感知网络用于航空到地面图像合成

通过引入结构对齐和语义感知的方法，本文提出了一种新的框架来解决航空图像到地面图像合成的挑战，通过将航空图像的特征与地面布局对齐，实现了复杂地理结构的重建，同时通过引入预训练分割网络，通过计算不同类别的损失并平衡它们，实现了跨类别综合样式的生成。通过与现有方法的比较和削减研究，本方法在质量和数量上显示出了有效性。

Aug, 2023

使用生成对抗网络的无监督领域自适应在航空影像语义分割中的应用

本文研究利用生成对抗网络减少领域适应在空中图像语义分割中的影响，并在实验中测试表明，在 Potsdam 领域（源领域）到 Vaihingen 领域（目标领域）的转变中，该方法将整体准确性从 35% 提高到 52%。

May, 2019

利用摄影测量网格模型进行空地特征点匹配，实现集成化三维重建

在城市环境中，使用航空和地面图像相结合的方法提高了地表重建的效率。为了解决来自视角和光照条件的巨大差异导致的特征点匹配困难的问题，本文提出了一种新方法，利用摄影测量网格模型进行相机标定和图像匹配，这种方法具有线性时间复杂度，可以解决多个问题，从而得到更为准确完整的模型。

Feb, 2020

一种基于语义分割的地空图像匹配方法

该论文提出了一种基于语义分析的方法，通过比较地面图像与卫星图像的特征，结合语义分割掩模，实现无 GPS 数据的查询地理定位，并在不同视场上通过对 CVUSA 数据集进行测试表明该方法提升了性能。

Apr, 2024

从航空图像预测地面场景布局

本文介绍了一种从航拍图像中提取语义特征的新策略，同时展示了通过该策略在地址估计和语义分割任务上的性能优于两种基线方法。

Dec, 2016

StereoGAN: 聚合域翻译和立体匹配的联合优化来桥接从合成到真实领域的差距

本研究提出了一种端到端的域翻译和立体匹配网络训练框架，通过引入双向多尺度特征重投影损失和相关性一致性损失等两个新颖的损失函数来提高合成立体图像到真实图像的转换效果以及维护单应约束，实验证明进行域翻译和立体匹配网络联合优化能够有效地解决合成数据集所引入的领域偏差问题，从而实现更准确的立体匹配。

May, 2020

跨域自监督多任务特征学习：使用合成图像

本文提出了一种多任务深度网络学习通用高级视觉表示的方法，并通过对人工制成的图像进行训练来克服真实与合成数据之间的领域差异，模型考虑同步从合成 RGB 图像中预测其表面法向、深度和实例轮廓，并最小化真实和合成数据之间特征空间的差异，在广泛实验的基础上，表明我们的网络相比单任务基线学习到更具有可转移性的表示，使得在 PASCAL VOC 2007 分类和 2012 检测上能够产生最先进的迁移学习结果。

Nov, 2017