LoLep: 基于本地学习平面和自注意力遮挡推断的单视图合成

ICCVJul, 2023

LoLep: 基于本地学习平面和自注意力遮挡推断的单视图合成

LoLep: Single-View View Synthesis with Locally-Learned Planes and Self-Attention Occlusion Inference

Cong Wang, Yu-Ping Wang, Dinesh Manocha

TL;DR我们提出了一种新的方法 LoLep，通过从单个 RGB 图像回归学习本地平面，准确地表示场景，从而生成更好的新视图。该方法将深度信息从中剔除，且在无深度信息的情况下回归合适的平面位置是一个具有挑战性的问题。为了解决这个问题，我们将视差空间预划分为不同的区间，并设计了一个视差采样器用于在每个区间中回归多个平面的局部偏移量。然而，仅使用这样的采样器会导致网络无法收敛；因此我们进一步提出了两种优化策略，将其与不同数据集的视差分布相结合，并提出了一种考虑遮挡的再投影损失作为一种简单有效的几何监督技术。我们还引入了一种自注意机制以改善遮挡推断，并提出了一个块采样自注意力模块（BS-SA）来解决将自注意力应用于大型特征图的问题。我们证明了我们的方法的有效性，并在不同数据集上生成了最先进的结果。与 MINE 相比，我们的方法在 LPIPS 方面有 4.8%-9.0% 的减少和 83.1%-84.7% 的 RV 减少。我们还评估了在现实世界图像上的性能，并展示了其优势。

Abstract

We propose a novel method, lolep, which regresses Locally-Learned planes from a single RGB image to represent scenes accurately, thus generating better novel views. Without the depth information, regressing appro

lolep planes novel views disparity self-attention

发现论文，激发创造

在野外应用学习的自适应多面板图像进行单视图合成

本文提出一种基于多平面图像（MPI）表示的新方法来合成野外照片的新视角，结合深度估计和颜色填充技术，通过多平面图像表示解决具有复杂 3D 几何的场景，使用大规模立体训练数据并经过实验验证达到最新成果。

May, 2022

PlaneDepth: 基于正交平面的自监督深度估计

本文提出了一种基于正交平面的深度估计方法 PlaneDepth，使自监督学习中的深度估计更为精确，同时解决了自动驾驶中分割、补洞等问题，实现了无监督地提取地面平面，为自动驾驶技术的发展提供了有效支持。

Oct, 2022

DeepView: 用学习梯度下降生成视图合成

利用多平面图像 (MPI)，采用基于梯度下降的学习方法，使用来自一组稀疏摄像机视角的图像，实现视点合成，并具有遮挡理解功能，在具有高深度复杂性的场景中，改进了物体边界、光反射和薄结构等具有挑战性的场景特点，并且在我们提供的 Kalantari 光场数据集和全新的 Spaces 相机阵列数据集上均获得了高质量的最新成果。

Jun, 2019

自监督单目 3D 人脸重建：基于遮挡感知多视角几何一致性

本文提出了基于多视角几何一致的自监督训练架构，目标是在面部姿态和深度估计过程中提供可靠的约束。实验结果表明，该方法在面部姿态、表情和光照等方面的变异下都表现出优越性。

Jul, 2020

通过正交平面分离和多视角几何一致性感知进行 360 布局估计

通过提出正交平面解缠网络 (DOPNet) 以分辨模糊语义和针对水平深度与比例的无监督自适应技术，本研究在全景布局估计和多视角布局估计任务中优于其他 SoTA 模型。

Dec, 2023

利用多平面图像推动视角插值的边界

该论文探讨了使用极窄基线对图像进行视角合成的问题，并着重于生成带有合理深度间隙的高质量视角推断，提出了一种理论分析显示 MPI 的视角范围如何随着 MPI 视差采样频率的增加而线性增加，并提出一种 MPI 预测程序，理论上使视角推断的范围扩展了至少 4 倍。

May, 2019

单幅图像的适应性场景层次多平面图像表示与新视角合成

基于改进的多平面图像（MPI），本文介绍了一种适应场景的分层多平面图像表示，用于从单幅图像合成新视角，观察到对于无界户外场景，深度分布变化显著，因此采用自适应分组策略来排列平面，进一步引入了分层细化分支，以呈现精细的几何和多尺度细节，该方法在 KITTI 数据集上合成大规模无界户外场景并具有显著的性能提升，在未见过的 Tanks and Temples 数据集上具有较好的泛化性能，代码和模型将公开。

Sep, 2023

基于单视角 RGB-D 的占据平面人体重建

该研究通过使用 OPlanes 表示法，将单视图 RGB-D 人类重建问题转化为在通过相机视锥切面的平面上的占位符预测，从而实现更精确的预测结果。在具有其他障碍物和部分可见性的复杂情况下，该方法在 S3D 数据上实现了更好的表现。

Aug, 2022

基于单目神经网络的连续视角控制图像渲染

本文提出了一个自监督学习的方法，通过深度引导的调整过程，利用变换自编码器的网络结构，在只有 2D 图像和相关视角变换的情况下精确合成高质量的 3D 对象或场景的新视角，并实现了细粒度和精密的六自由度视角控制。通过在合成和真实场景以及精细和固定视角设置下的彻底评估，证明了该方法的广泛适用性。

Jan, 2019

多任务计划形状重建与特征扭曲引导

基于改进的实例分割架构的实时平面重建模型 SoloPlanes，同时预测每个平面实例的语义、平面参数和分段平面实例掩码，通过提供特征空间中的多视角指导，在单张图像推理时同时预测语义，并以 43 帧每秒的实时预测效果。

Nov, 2023