CrossLoc: 多模态合成数据辅助的可扩展空中定位
视觉地理定位方法的多阶段课程学习以及全局和局部特征的关键点检测、描述和位置调整使其成为一种实用的视觉地理定位解决方案,取得了高召回率的好成绩。
Nov, 2023
本研究中,我们提出了一种名为 Synfeal 的数据驱动模拟器,通过在真实世界的逼真三维重建中移动虚拟摄像机并收集相应的地面真实摄像机姿势来合成真实场景的大型定位数据集。通过使用 Synfeal 合成数据集并对其进行有针对性的训练,本文证明了这能够优于其他数据集的训练效果,而且当数据集的大小越大时,算法的性能也显著提高。
May, 2023
我们提出了一个用于多样化合成数据集中人体姿势的框架,该框架利用姿势生成器构造一组新颖的姿势,并使用图像翻译器改变现有合成数据集中的图像以呈现新颖的姿势,同时保持原始风格。通过实验证明,无论合成数据如何被用于训练,以及数据规模如何,利用多样化的合成数据集进行训练都比在少样本情况下使用原始合成数据集对于三个航拍人体检测基准(VisDrone,Okutama-Action 和 ICG)的准确性通常明显更好。
May, 2024
本研究提出了一种用已有数据集进行数据注释以生成多模态数据的方法,以优化智能车辆系统中的数据模拟,实现高保真模拟并增加样本多样性并成功改善了语义分割的实验效果。
Aug, 2022
我们提出了一种可扩展的数据生成流程,以应用于空中自主飞行。该流程利用自适应层次域随机化方法为无人机轨迹生成之前的环境基础地图上的资产创造无类型分布空间,通过障碍物生成和全局参数随机化扩展多样性,以自动产生多样且逼真的模拟场景配置和数据集,以便更好地推广到真实情况下的模型。
Nov, 2022
使用新型的激光雷达 SLAM 技术和结构运动优化方法在大型商场和地铁站获取室内数据集以便于在室内环境中进行视觉定位,并测试现代化的视觉定位算法,证明结构基方法使用健壮的图像特征具有更高的性能。
May, 2021
通过将原始图像的视图不变外观特征和合成图像的视图依赖空间 - 语义特征相结合,利用图神经网络进行压缩学习和识别,该方法在一个包含多个未见过视觉的交叉视图自定位数据集中得到了验证。
Oct, 2023
CyberLoc 是一种图像定位管道,可在困难条件下实现稳健且准确的长期位姿估计;该方法由四个模块组成,包括地图构建、基于单个图像的定位、一致性最大化、鲁棒姿态优化,实验结果表明该方法能够在 Map-based Localization for Autonomous Driving 中获胜
Jan, 2023
提出了一种名为 RePoGen 的人体姿势综合控制方法,它可以生成具有极端视角和姿势的图像,我们使用这种方法来增强 COCO 数据集,实验证明,添加 RePoGen 数据后,可以超过以前的顶视姿态估计算法,同时显著提高底视点数据集的性能。
Jul, 2023
本文提出了一种基于图像的定位方法,使用本地特征和稀疏的三维模型进行全球规模的离线和在线实时客户端姿态融合,实现低延迟本地化查询,证明了该方法在大规模模型上的有效性。
Jun, 2019