单图像摄像机标定的神经几何解析器

ECCVJul, 2020

单图像摄像机标定的神经几何解析器

Neural Geometric Parser for Single Image Camera Calibration

Jinwoo Lee, Minhyuk Sung, Hyunjoon Lee, Junho Kim

TL;DR我们提出了一个神经几何解析器，通过学习使用单个图像进行机器场景的相机校准。相比之前仅依赖于神经网络得到的语义提示的神经网络方法，我们的方法同时考虑了语义和几何提示，从而显著提高了准确性。

Abstract

We propose a neural geometric parser learning single image camera calibration for man-made scenes. Unlike previous neural approaches that

neural geometric parser single image camera calibration man-made scenes semantic and geometric cues camera rotation and focal length

发现论文，激发创造

深度单张图像相机标定的感知度量

本论文提出使用一个深度卷积神经网络直接推断相机标定参数，其优于各种其他方法，包括最近的基于深度学习的方法，并通过人类感知研究展示其实用性。

Dec, 2017

UprightNet：从单张图像中几何感知相机方向估计

UprightNet 是一种学习方法，通过使用几何推理，从单张室内场景的 RGB 图像中估计相机的 2DoF 方向；该方法中包含了一个神经网络，可以在两个不同的坐标系中预测场景的几何表示，并通过可微的最小二乘模块解决相机定向问题，从而实现了端到端的训练并且在合成和真实数据集上实现了明显的优化。

Aug, 2019

基于旋转和投影矩阵的几何约束相机标定

相机标定是估计内参和外参参数的过程，本文提出了一种基于几何约束的损失函数来测量相机参数，并通过神经网络学习框架进行优化，实验结果表明，在合成和实际数据集上，相比最先进的基准模型，我们的方法在所有参数上都有所改进。

Feb, 2024

CTRL-C: 带有线分类的相机标定转换器

本文针对单张图像相机标定提出了一种基于端到端神经网络的方法 - Camera calibration TRansformer with Line-Classification (CTRL-C)，采用 Transformer 架构有效提取全局几何信息，并辅以线分类任务训练网络，实验表明该方法在 Google Street View 和 SUN360 benchmark 数据集上超越了现有最优方法。

Sep, 2021

FoveaNet: 透视感知的城市场景解析

基于透视几何的 FoveaNet 模型通过卷积神经网络估算场景图像的透视几何信息来解决因实际场景摄像机的透视投影造成的物体尺度异质性问题，进而提供更稳健的解析结果。同时，引入基于透视几何的密集 CRFs 模型有效解决边界和识别错误。在 Cityspaces 和 CamVid 两个城市场景的解析数据集上验证了 FoveaNet 模型的优越性和最新的性能表现。

Aug, 2017

全几何全景定位

介绍了一种利用 2D-3D 线条几何的轻量级而准确的定位方法，通过全景视图来定位，避免了训练或手工制作视觉描述符，提取线条关系中的主导方向和非平行线条的交点等以表达独特而紧凑的空间上下文，其结果表示与传统视觉描述符方法相比，处理时间和内存上更加高效；验证了该方法在具有相似结构、领域转变或光照变化的挑战性场景中的定位效果；由于是完全几何的方法，无需进行庞大的参数调整或神经网络训练，因此具有实际应用价值，可以直接部署在实际世界中。

Mar, 2024

通过几何约束从单张图片学习预测三维车道形状和相机姿态

本研究提出了一种基于两个阶段的框架，通过从单个图像中估计相机姿态来预测 3D 车道，使用辅助的 3D 车道任务和几何约束来获得多任务学习的好处，增强 3D 和 2D 之间的一致性和在这两个任务之间的兼容性，在没有地面真值相机姿态的情况下，我们的方法胜过基于完美相机姿态的最先进方法，并且具有最少的参数和计算量。

Dec, 2021

GP2C：约束几何投影参数的一致性以估计关节 3D 姿势和在野外的焦距

我们提出了一种联合 3D 姿态和焦距估计方法，采用深度学习技术和几何算法，通过将焦距明确地估计和整合到 3D 姿态估计中来实现对野外物体类别的姿态和焦距估计，并在 Pix3D、Comp 和 Stanford 三个具有不同物体类别的具有挑战性的真实世界数据集上进行了详细的评估，结果在多个指标上明显优于现有方法。

Aug, 2019

无模型畸变校正的单张图像相机标定

提出了一种从单幅图像中估计完整的标定参数集的方法，通过数字图像相关获得图像点和标定目标上物理点之间的对应关系，同时在先前评估了主点之后分别计算出有效焦距和外部参数，最终获得整个图像上密集均匀的无模型畸变图。

Mar, 2024

单目视频中几何约束的自监督学习：连接光流、深度和相机

GLNet 是一种自监督框架，可从单目视频中学习深度估计、光流、相机姿态和内在参数，包括设计考虑多种几何约束及自适应光度损失的新型损失函数、扩展模型以预测相机内参、提出几种在线细化策略。在 KITTI 和 Cityscapes 数据集上，GLNet 优于以前的自监督方法，并且在 YouTube 视频中表现良好。

Jul, 2019