深度学习在俯视全景成像中的应用：综述

Apr, 2023

深度学习在俯视全景成像中的应用：综述

Applications of Deep Learning for Top-View Omnidirectional Imaging: A Survey

Jingrui Yu, Ana Cecilia Perez Grassi, Gangolf Hirtz

TL;DR该论文综述了深度学习在结合全景鱼眼摄像机的视觉任务中的应用，包括物体检测、活动识别等，利用鱼眼镜头的全向视野可以大大减少部署所需的工作和成本。

Abstract

A large field-of-view fisheye camera allows for capturing a large area with minimal numbers of cameras when they are mounted on a high position facing downwards. This top-view omnidirectional setup greatly reduce

fisheye camera omnidirectional deep learning object detection activity recognition

发现论文，激发创造

基于图的全向图像分类

本研究使用基于图的方法来考虑全向相机的几何形式，并将其扩展到深度学习体系结构中，旨在提高全向图像分类的准确性。实验证明所提出的方法优于当前用于全向图像分类问题的技术。

Jul, 2017

OmniMVS：全向立体匹配的端到端学习

本文提出了一种新颖的端到端深度神经网络模型，用于从广角多视角立体成像中实现全向深度估计，并提出了大规模的合成数据集来用于算法的训练与测试。结果表明，所提出的方法在合成和实际环境中都生成了出色的结果，并优于现有技术。

Aug, 2019

适应全景视频的计算机视觉算法

本研究概述了全向（360 度）视频在计算机视觉算法中面临的挑战，如广泛采用的特殊（equirectangular）投影和巨大的图像尺寸，并提出了适应全向视频特定需求的计算机视觉算法策略。

Jul, 2019

OmniDet：基于全景摄像头的自动驾驶多任务视觉感知网络

本文提出在未经校正的鱼眼图像上运行的多任务视觉感知网络来加强自动汽车系统的六个主要任务，其中包括深度估计，视觉测距，语义分割，动态分割，目标检测以及镜头污染检测，通过联合训练模型，在 KITTI 数据集上实现深度估计和姿态估计任务的最新结果。

Feb, 2021

SweepNet: 宽基线全向深度估计

本文提出了一种新颖的广基线全向立体算法，使用深度卷积神经网络从鱼眼图像计算密集深度估计，直接生成具有全 360 度覆盖的密集全向深度图，该算法的实验结果表明，在合成和实际数据集上，比传统的深度估计方法具有更高的准确性。

Feb, 2019

从 THEODORE 学习：用于深度迁移学习的合成全景室内顶视数据集

本文介绍一个新的大规模室内合成数据集 THEODORE，包含 100,000 张物体的高分辨率多样化鱼眼图像，附带语义分割、实例掩模和物体检测任务的边界框注释，通过图像合成和域随机化高度泛化我们的模型，AP 可达 0.84

Nov, 2020

OmniSCV：一种面向计算机视觉的全向合成图像生成器

我们提出了一个工具，用于生成具有语义和深度信息的全向图像数据集。这些图像是从采集于虚拟环境中的捕捉集合中合成的，能够提供像素级的关于语义、深度以及摄像头的校准参数的信息，从而为机器学习算法的训练和三维视觉方法的测试提供了像素精度的真实信息。

Jan, 2024

消除盲区：将 3D 物体检测和单目深度估计应用于 360° 全景图像

本研究提出了一种处理全景图像的深度学习算法，通过样式和投影转换，重新训练和调整现有的算法，从单目全景图像中恢复场景深度和车辆的三维姿态，大大提高了无人驾驶汽车使用全景摄像头时的准确性。

Aug, 2018

360 度广域：深度预测与视角合成数据集

本文介绍了一个大规模 360 度视频数据集，包含各种环境和上下文，以及相机的姿态和深度图，证明了该数据集在单一图像深度估计和视图合成两个主要任务中的相关性。

Jun, 2024

球形视觉 Transformer 用于 360 度视频显著性预测

提出了一个基于视觉转换器的新型全景视频模型 SalViT360，利用切线图像表示，在球面几何感知的时空自注意机制方面提出了一种有效的全景视频理解方法，并引入了一种基于一致性的无监督正则化项以减少 360 度密集预测模型中逆投影之后出现的伪影，实验证明了该方法在三个全景视觉显著性数据集上的有效性超过了现有技术。

Aug, 2023