CrossLoc: 多模态合成数据辅助的可扩展空中定位

CVPRDec, 2021

CrossLoc: 多模态合成数据辅助的可扩展空中定位

CrossLoc: Scalable Aerial Localization Assisted by Multimodal Synthetic Data

Qi Yan, Jianhao Zheng, Simon Reding, Shanci Li, Iordan Doytchinov

TL;DR本研究提出了一个基于合成数据学习估计真实世界中摄像机姿态的视觉定位系统，通过自我监督的交叉模态视觉表示学习方法，在不需要额外数据的情况下，大大提高了神经网络性能。

Abstract

We present a visual localization system that learns to estimate camera poses in the real world with the help of synthetic data. Despite significant progress in recent years, most learning-based approaches to

visual localization synthetic data neural network pose estimation self-supervision

发现论文，激发创造

CurriculumLoc: 通过多阶段改进增强跨领域地理定位

视觉地理定位方法的多阶段课程学习以及全局和局部特征的关键点检测、描述和位置调整使其成为一种实用的视觉地理定位解决方案，取得了高召回率的好成绩。

Nov, 2023

Synfeal: 基于数据驱动的端到端相机定位模拟器

本研究中，我们提出了一种名为 Synfeal 的数据驱动模拟器，通过在真实世界的逼真三维重建中移动虚拟摄像机并收集相应的地面真实摄像机姿势来合成真实场景的大型定位数据集。通过使用 Synfeal 合成数据集并对其进行有针对性的训练，本文证明了这能够优于其他数据集的训练效果，而且当数据集的大小越大时，算法的性能也显著提高。

May, 2023

多样化的合成数据中的人体姿态对于航空视角人体检测的作用

我们提出了一个用于多样化合成数据集中人体姿势的框架，该框架利用姿势生成器构造一组新颖的姿势，并使用图像翻译器改变现有合成数据集中的图像以呈现新颖的姿势，同时保持原始风格。通过实验证明，无论合成数据如何被用于训练，以及数据规模如何，利用多样化的合成数据集进行训练都比在少样本情况下使用原始合成数据集对于三个航拍人体检测基准（VisDrone，Okutama-Action 和 ICG）的准确性通常明显更好。

May, 2024

TRoVE：将道路场景数据集转换成逼真的虚拟环境

本研究提出了一种用已有数据集进行数据注释以生成多模态数据的方法，以优化智能车辆系统中的数据模拟，实现高保真模拟并增加样本多样性并成功改善了语义分割的实验效果。

Aug, 2022

可扩展的模块化合成数据生成用于推进航空自主技术

我们提出了一种可扩展的数据生成流程，以应用于空中自主飞行。该流程利用自适应层次域随机化方法为无人机轨迹生成之前的环境基础地图上的资产创造无类型分布空间，通过障碍物生成和全局参数随机化扩展多样性，以自动产生多样且逼真的模拟场景配置和数据集，以便更好地推广到真实情况下的模型。

Nov, 2022

拥挤室内环境的大规模定位数据集

使用新型的激光雷达 SLAM 技术和结构运动优化方法在大型商场和地铁站获取室内数据集以便于在室内环境中进行视觉定位，并测试现代化的视觉定位算法，证明结构基方法使用健壮的图像特征具有更高的性能。

May, 2021

从合成的场景图进行的跨视图自定位

通过将原始图像的视图不变外观特征和合成图像的视图依赖空间 - 语义特征相结合，利用图神经网络进行压缩学习和识别，该方法在一个包含多个未见过视觉的交叉视图自定位数据集中得到了验证。

Oct, 2023

CyberLoc：实现准确的长期视觉定位

CyberLoc 是一种图像定位管道，可在困难条件下实现稳健且准确的长期位姿估计；该方法由四个模块组成，包括地图构建、基于单个图像的定位、一致性最大化、鲁棒姿态优化，实验结果表明该方法能够在 Map-based Localization for Autonomous Driving 中获胜

Jan, 2023

使用合成数据提高跨视角 2D 人体姿态估计

提出了一种名为 RePoGen 的人体姿势综合控制方法，它可以生成具有极端视角和姿势的图像，我们使用这种方法来增强 COCO 数据集，实验证明，添加 RePoGen 数据后，可以超过以前的顶视姿态估计算法，同时显著提高底视点数据集的性能。

Jul, 2023

大规模实时视觉惯性定位重访

本文提出了一种基于图像的定位方法，使用本地特征和稀疏的三维模型进行全球规模的离线和在线实时客户端姿态融合，实现低延迟本地化查询，证明了该方法在大规模模型上的有效性。

Jun, 2019