相机定位的场景标记检测改进

Jan, 2024

Improved Scene Landmark Detection for Camera Localization

Tien Do, Sudipta N. Sinha

TL;DR基于场景地标检测的摄像头定位方法，采用卷积神经网络（CNN）检测少量特定的场景 3D 点或地标，并从相关的 2D-3D 对应中计算摄像头姿态，具有与基于 3D 结构的方法相当的准确性，但速度更快且使用存储空间更少。

Abstract

camera localization methods based on retrieval, local feature matching, and 3D structure-based pose estimation are accurate but require high storage, are slow, and are not privacy-preserving. A method based on scene landmark detection (SLD) was recently proposed to address these limita

camera localization scene landmark detection convolutional neural network 3d structure-based methods dense reconstructions

发现论文，激发创造

通过密集场景匹配学习相机定位

本文提出一种基于 DSM 和 CNN 的相机场景无关的定位方法，可应用于大范围场景，能够在时间领域实现额外的性能提升，大大优于 SANet 等现有方法。

Mar, 2021

通过发现锚点改善视觉重定位

本文提出了一种基于深度学习的方法，通过视觉定位，使用锚点来预测场景的位置和摄像机方向或姿态（6 自由度），该方法使用统一定义的锚点并提出了一个深度学习架构，该架构预测场景中存在的最相关的锚点以及相对偏移量，并为该任务提出了一个多任务损失函数，无需基于真实位置信息评定，并在 CambridgeLandmarks 和 7 Scenes 上进行了实验以验证效果。与使用相同的特征提取器的先前最佳深度学习模型 Posenet（具有几何重投影损失）相比，我们的方法提升了室内和室外定位数据集中的中位误差，并在特定情况下，如街景中，将中位误差降低了 8m 以上。

Nov, 2018

利用地标分布描述符进行视觉场所识别

本研究中，我们建立了从地标特征中提取的描述符，该描述符还编码了视图中地标的空间分布，匹配描述符然后强制实施地标在视图之间的相对位置的一致性，这对性能有显着影响。在 10 个图像对数据集上的实验中，每个数据集都由 200 个城市地点组成，观察位置和条件有显着差异，我们记录了大约 70％的平均精度（在 100％召回率下），而使用整个图像 CNN 特征获得了 58％，[1] 方法获得了 50％。

Aug, 2016

构造感知完全卷积神经网络的对抗学习用于地标定位

通过结构感知的全卷积网络以及 GAN 的显式 / 隐式学习策略，该论文提出了一种解决单目图像中姿态估计问题的方法，并在 2D 和 3D 姿态估计以及人脸重要标识等相关任务上显著优于现有方法。

Nov, 2017

使用 LSTM 进行基于图像定位的结构化特征相关性

本研究提出了一种新的基于 CNN+LSTM 的摄像机姿态回归方法，该方法针对室内和室外场景，并且通过 CNN 可学习适合的特征表征来进行定位，使用 LSTM 作为特征向量的结构化降维方法，在定位性能方面取得了极大的改善，并针对基于 CNN 和 SIFT 的定位方法进行了广泛的定量比较，还提出了一种新的基于激光扫描的大型室内数据集，实验结果表明，我们的方法在定位图像时性能优于现有的深度体系结构，在具有挑战性的环境下都能够成功定位。

Nov, 2016

面部特征点检测的深度结构预测

本文提出了一种深度结构化面部标记检测方法，该方法使用深度卷积网络和条件随机场相结合，能够在面部标记检测上取得比现有技术更卓越的性能，特别是在包含大姿态和遮挡等具有挑战性的数据集上具备更好的泛化性能。

Oct, 2020

无限 3D 关键点：提升连续 2D 面部关键点检测

这篇论文主要探讨了人脸标记探测器的实际应用中存在的三个重要问题，并展示了如何通过特定的架构改进来提高其准确性和时间稳定性。

May, 2024

基于地标引导的语义部件分割的 CNN 级联

本文提出一种卷积神经网络级联架构，利用关键点嵌套的姿态特定信息进行语义部件分割，经测试该网络在面部数据集上具有较高性能。

Sep, 2016

语义对齐和物体关键点检测的联合学习

本文提出了一种基于卷积神经网络的联合学习方法，以在语义相似的图像中获得稠密对应和发现对象地标，在解决训练数据不足方面取得了显著成效，并引入了概率学习方法以提高框架的稳健性，该方法在语义匹配和地标检测的多个标准基准测试中取得了最新的最佳表现。

Oct, 2019

利用半监督学习改进地标定位

本研究提出了两种技术来改善局部标记数据集中的地标定位。第一种技术是顺序多任务，利用分类或回归任务的类标签引导未标记数据的局部标记定位。第二种是基于无监督学习的方法，通过模型预测图片上的等变地标来提高地标定位，本文在两个玩具数据集和四个实际数据集上进行实验，包括手和脸部，并在只有 5％标记图像的条件下，跑过了之前在 AFLW 数据集上的最新 state-of-the-art 算法。

Sep, 2017