多视角暂态非参数融合的立体视觉

ICCVApr, 2019

多视角暂态非参数融合的立体视觉

Multi-View Stereo by Temporal Nonparametric Fusion

Yuxin Hou, Juho Kannala, Arno Solin

TL;DR提出基于多视图图像 - 姿态对的深度估计新方法，使用编码器 - 解码器模型进行差异性估计，通过非参数高斯过程约束信息，提高姿态相似性使得潜在空间主题相像，用高斯过程适应性融合前几个视图生成信息，见证其运行于智能设备的实时估计方案。

Abstract

We propose a novel idea for depth estimation from multi-view image-pose pairs, where the model has capability to leverage information from previous latent-space encodings of the scene. This model uses pairs of im

depth estimation multi-view images latent-space encodings gp prior real-time inference

发现论文，激发创造

DeepVideoMVS：基于重复时空融合的多视点视频立体匹配

该论文提出了一种在线多视角深度预测方法，使用 ConvLSTM cell 实现对过去一定量信息的压缩，并考虑了时间步之间的视点变化，通过对先前的深度预测进行位移实现细胞的隐藏态的传播。该方法在实时性能的基础上带来了显著的深度预测的提高，并在数百个室内场景中表现出了优异的状态，代码详见 https://thisURL。

Dec, 2020

面向视图感知推断的高斯过程先验

提出了一种深度模型结合信息耦合的理论框架，使用软先验知识帮助处理视觉问题，如新视角合成、预测生成模型的潜在空间等。

Dec, 2019

从宽基线立体对学习生成新视角

介绍了一种用于单个广角立体图像对的新视角合成的方法，包括 3D 场景重构和外观变化的先验模型，提出了一种多视角变换编码器、图像上的极线采样方案和轻量级交叉注意力渲染器，通过大规模实际数据集的训练，证明了模型学习到了强大的多视角几何先验，大大缩短了渲染时间，并在两个实际数据集上得到了显著的优越性能。

Apr, 2023

实现视角不变的三维人体姿势估计

提出了一种视角不变的模型，用于从单个深度图像中估计 3D 人体姿态，该模型从一个学习的视角不变特征空间中嵌入局部区域来实现，并采用自下而上的误差反馈机制进行姿态估计，多任务的学习方法可以在噪声和遮挡的情况下选择性地预测局部姿态。通过对一个先前发布的深度数据集和一个包含 10 万个注释深度图像的新收集的人体姿态数据集的评估，实验证明该模型在正面视图上实现了竞争性性能，在替代视角上实现了最先进的性能。

Mar, 2016

VolumeFusion：基于深度学习的三维场景重建深度融合技术

本文介绍了一种利用深度神经网络复制传统的 local depth maps calculation 和 global depth maps fusion 两步骤框架，以改善对 3D 场景重建精度和可解释性的计算机视觉任务方法。此外，作者还提出了一种称为 PosedConv 的旋转不变的 3D 卷积核，用于提高从非常不同视角获取的图像之间的匹配效率。作者在 ScanNet 数据集上进行了大量实验证明提出的方法在深度神经网络和传统计算机视觉技术中具有竞争力。

Aug, 2021

跨域对象姿态估计的多路径学习

提出了一种可扩展的对象姿态估计方法，使用多个三维模型的模拟 RGB 视图进行训练，并使用所谓的 “多路径学习” 技术，涉及共享编码器和不同解码器，从而实现对不同实例的通用编码器的训练。在多个数据集上实现了最先进的 6D 目标检测结果。

Aug, 2019

使用学习编码的场景表示进行单目密集语义重建

该研究提出了一种基于变分自编码器的语义表示方法，实现了对三维语义地图的实时增量建立与空间一致的语义标签融合，可以用于单目关键帧语义映射系统，并能够实现对位姿、几何和语义的联合优化。

Mar, 2019

基于非参数深度分布建模的多视角立体匹配深度推断

通过非参数深度分布建模构建成本体积，避免错误检测。同时，我们使用稀疏成本聚合网络推导每个体积中的信息。在 DTU 和坦克与神殿这两个基准数据集上广泛评估我们的方法，实验结果表明，我们的模型以显着优势胜过现有方法，并在边界区域实现卓越性能。

May, 2022

学习先验概率的概率融合用于标准 3D 重建流水线

本研究提出将单视角深度先验与传统三维重建系统融合，通过预测概率分布并使用代价函数最小化来提取深度图，并证明了该方法在整个系统性能方面的优越性。

Jul, 2022

神经融合：隐空间中的在线深度融合

本文提出了一种新颖的在线深度图融合方法，该方法使用潜在特征空间学习深度图聚合，并通过附加的翻译器网络在场景表示和输出场景表示之间分离，该方法适用于处理高噪声等异常值，实验结果表明，与现有技术相比，在处理大量噪声和异常值的挑战性场景中获得了改进。

Nov, 2020