- 基于局部特征的视觉定位的受约束近似最近邻算法 (CANN)
本文提出了一种名为 Constrained Approximate Nearest Neighbors (CANN) 的近似 K 最近邻联合解决方案,该方案只使用局部特征进行跨几何和外观空间的 K 最近邻检索以提高视觉定位的性能,并且在公共 - Eiffel Tower: 一种用于长期视觉定位的深海水下数据集
本研究提供了一个新的深海数据集,通过四次不同时间拍摄的同一海底热液喷口的图像,评估了多种长期水下定位技术的效果,对数据进行了分析并揭示了多年来的主要变化。
- 从相机姿态恢复场景内容 —— 保护隐私的表征不足
本文针对现代视觉定位算法所具备的外观和几何作用稳健性,在攻击者不使用任何云服务访问的情况下,开发了一个现场细节攻击方案,并展示了其实用性。
- HSCNet++:基于 Transformer 的分层场景坐标分类和回归用于视觉定位
本文提出了一种新的 Hierarchical Scene Coordinate 网络,可以在一个像素级的场景坐标的预测中,以逐层递进地方式执行粗到细的预测,这种新方法在单图像定位方面表现出较好的性能,并在 7-Scenes,12 Scene - CVPRSFD2: 语义引导的特征检测与描述
本文提出了一种将高级语义隐式嵌入到检测和描述过程中的语义感知检测器来提高视觉定位准确度的方法,大幅降低了对于外观变化敏感的特征数量,增强了与语义相关的区域的描述符辨别能力,该方法在 Aachen Day-Night 和 RobotCar-S - 语言引导的局部渗透用于交互式图像检索
提出使用语言引导的本地渗透系统模块,包括语言提示视觉定位模块和带有本地感知的文本渗透模块,用于精确修改引用图像并生成图像 - 文本滤入表示。实验结果表明,我们的方法优于大部分最先进的交互图像检索方法。
- 从单张图片中确定二维地图上的位置和朝向:Flatlandia 定位问题与数据集
Flatlandia 是一个解决由两个特定任务组成的视觉定位问题的创新性问题,包括粗略地图定位和细粒度 3DoF 定位,开发人员使用提供的 Flatlandia 数据集进行验证。
- CVPR利用互联网不完整的 3D 模型的视觉定位
本文探讨了互联网上获取的 3D 模型对于视觉定位的不精确性以及如何处理构建一个更加准确的场景表示,研究人员创建了一个基准测试,以评估基于多个 3D 模型的视觉本地化问题的准确性。
- CVPROrienterNet:使用神经匹配在 2D 公共地图中进行视觉定位
论文提出了 OrienterNet,这是一个可以使用 2D 语义地图对图像进行亚米级别本地化的深度神经网络,通过匹配神经鸟瞰与来自 OpenStreetMap 的开放和全球可用地图,可以使任何人在这些地图提供的地方进行本地化。 Orient - CVPR3D 线条映射再探讨
本文介绍了一种名为 LIMAP 的库,用于从多视角图像中稳健高效地创建 3D 线路图,该库通过重新审视线三角化的退化问题、精心制作的得分和跟踪构建以及利用线 / 点的结构先验知识来实现。在全面实验中,我们展示了 LIMAP 在 3D 线路图 - ECCVCyberLoc:实现准确的长期视觉定位
CyberLoc 是一种图像定位管道,可在困难条件下实现稳健且准确的长期位姿估计;该方法由四个模块组成,包括地图构建、基于单个图像的定位、一致性最大化、鲁棒姿态优化,实验结果表明该方法能够在 Map-based Localization f - CVPRFeatureBooster: 用轻量级神经网络增强特征描述子
我们介绍了一种轻量级网络,用于提高同一图像中关键点描述符的准确性,并在图像匹配、视觉定位和结构运动任务中进行评估,结果显示我们的方法显著提高了每项任务的性能,特别是在具有挑战性的情况下,例如大的照明变化或重复图案。
- ECCV神经密度 - 距离场
该论文提出了一种新的三维表示方法 Neural Density-Distance Field (NeDDF),同时约束距离场和密度场,从而实现了稳健的初始化和高质量的配准,并在新视角合成方面达到了与 NeRF 相当的结果。
- ECCVMeshLoc:基于网格的视觉定位
通过探索一种基于密集三维网格的更为灵活的方法,本文旨在解决基于图像的特征匹配对在构建场景表示上造成的代价,并通过在渲染场景几何图形时提取特征的方式,展示了这一方法达到了最新成果。结果表明,基于密集三维模型的表示是现有表示的一种有前途的替代方 - ECCVCPO: 改进鲁棒性普通全景转换为点云定位
CPO 是一种针对 2D 全景图像和 3D 点云进行快速和鲁棒定位的算法,通过使用色彩直方图和得分图进行可靠定位,其重点是处理包含场景变化的情况。
- 探究图像检索对视觉定位的作用 —— 一个详尽的基准测试
该研究论文研究了视觉定位中图像检索方法对定位性能的影响,并提出了专为定位场景设计的检索方法的需求。通过引入基准测试和多种 “地面真实性” 定义以及针对经典地标检索或地点识别任务的检索效能的分析,探讨了这种影响。
- 室内视觉定位的深度密集局部特征匹配和车辆去除
本文提出了一种使用深度密集局部特征匹配和车辆检测器相结合的视觉定位框架,以消除车辆造成的虚假匹配,实现对室内停车场的定位,并在基准数据集上取得了 86.9% 的准确率,表现优于现有方法。
- CVPROnePose:无 CAD 模型一次性物体姿态估计
本文提出了一种名为 OnePose 的新方法,可以在没有 CAD 模型的情况下对任意类别的物体进行物体姿态估计,利用视觉定位和图形注意力网络结合进行 2D 和 3D 特征匹配,结合基于特征的姿势跟踪器,可以实现对日常家用物品 6D 姿态的实 - CVPR异构 GNN 长期视觉地图稀疏化
本文介绍了一种使用图神经网络模型建模三维稠密地图为异构图并预测三维点重要性得分的方法,以选取具有未来重定位价值和稀疏地图覆盖的点。该方法在自适应环境中提取出稳定和广泛可见的地图点,并在定位性能方面优于基线模型。
- ECCV基于图像定位的语义描述符训练
本研究使用图像检索为基础的视觉定位方法,通过从语义分割图像中提取出的描述符可在强烈光照和季节变化的环境下实现可靠的定位,实验结果表明,这种方法的定位性能可与最先进的基于 RGB 图像的方法相媲美。