从航空图像预测地面场景布局
通过引入结构对齐和语义感知的方法,本文提出了一种新的框架来解决航空图像到地面图像合成的挑战,通过将航空图像的特征与地面布局对齐,实现了复杂地理结构的重建,同时通过引入预训练分割网络,通过计算不同类别的损失并平衡它们,实现了跨类别综合样式的生成。通过与现有方法的比较和削减研究,本方法在质量和数量上显示出了有效性。
Aug, 2023
本文旨在使用卷积神经网络来解决跨视角图像地理定位的问题,并介绍了用于地面图像和航拍图像的特征表示,并提出一种融合多个空间尺度提取的特征的网络架构,并通过实验表明其比现有方法更为优越。
Oct, 2015
本文研究了使用卫星图像语义分割实现自动生成地图的问题。通过使用不同的训练数据集进行对比分析,文章指出采用大规模公开标注来取代部分手动标注可以显著降低成本且不影响语义分割效果
Jul, 2017
本文提出了一种新的多任务、多阶段神经网络,能够在单次前向传递中同时处理语义分割和基于视觉的航拍图像地理定位两个问题,并在卫星图像中实现商用 GPS 级别的本地化精度以及在 Inria Aerial Image Labeling 数据集和 Massachusetts Buildings 数据集上达到领先水平的分割效果。
Apr, 2018
该论文提出了一种基于语义分析的方法,通过比较地面图像与卫星图像的特征,结合语义分割掩模,实现无 GPS 数据的查询地理定位,并在不同视场上通过对 CVUSA 数据集进行测试表明该方法提升了性能。
Apr, 2024
通过将 nosiy 的 2D 标签提升至 3D,我们提出了一种用于城市规模语义和建筑级别实例分割的神经辐射场方法。我们首先引入了一种适应尺度的语义标签融合策略,通过合并来自不同高度预测的标签来增强不同大小的对象的分割,然后基于 3D 场景表示引入了一种新颖的交叉视图实例标签分组策略,以减轻 2D 实例标签中的多视图不一致性问题。此外,我们利用多视图重构深度先验来改善重建辐射场的几何质量,从而实现了增强的分割结果。在多个真实世界的城市规模数据集上的实验表明我们的方法优于现有方法,突显了其有效性。
Mar, 2024
使用 Flickr 上的地面图像和深度学习方法进行土地利用地图绘制,并针对地理位置和室内 / 室外进行筛选和半监督数据增强,从而最终实现了 76% 的准确性。
Sep, 2016
本研究提出了一种基于条件 GAN 的新方法,通过合成俯视图像,将两个视图之间的差距最小化,实现了对视觉实体的跨视图建模并进行特征融合,最终在 CVUSA 数据集上成功实现了景点检索任务。
Apr, 2019