学习导航能量景观

Mar, 2016

Learning to Navigate the Energy Landscape

Julien Valentin, Angela Dai, Matthias Nießner, Pushmeet Kohli, Philip Torr...

TL;DR本文提出一种新颖高效的架构，用于解决使用 “分析与合成” 方法的计算机视觉问题，并在 RGB 相机重定位、手姿估计和图像检索任务上展示了其有效性。

Abstract

In this paper, we present a novel and efficient architecture for addressing computer vision problems that use `analysis by synthesis'. Analysis by synthesis involves the minimization of the reconstruction error w

computer vision analysis by synthesis hybrid architecture rgb camera relocalization hand pose estimation

发现论文，激发创造

神经拓扑 SLAM 用于视觉导航

本文研究图像目标导航问题，提出了一种基于拓扑表示法、语义特征和监督学习算法的解决方案，在视觉和物理仿真实验中部署该算法，与现有方法相比，在长时间任务中呈现出 50％以上的相对提高。

May, 2020

从合成训练数据中学习在新环境中进行定位

本文提出了一种可以适应不同场景的视觉定位方法，包括改进的模型架构、层次相关层和尺度和不确定性信息的利用。该方法优于使用 SIFT 特征的 5 点算法和之前训练在不同数据上的学习方法，并在只有很少的参考图像可用的情况下，明显优于现有的学习和经典方法。

Nov, 2020

递归标签校准实现无数据神经架构搜索

本文以深度预训练神经网络为基础，探究如何通过数据恢复技术以及自主生成的语义与多样性丰富的合成数据，实现在保护隐私，避免偏见等现实场景下，无需使用原始训练数据进行神经结构搜索的可行性和效果，并发现合成数据的神经结构搜索表现不亚于以往使用原始数据的搜索结果。

Dec, 2021

学习分析合成在 RGB-D 图像中的 6D 姿态估计

该研究提出了一种基于卷积神经网络（CNN）的后验概率密度的学习比较方法，可以更准确地进行物体的 6D 位姿估计。经过实验证明，相比于现有技术，在不同场景下且包括不同形状和外观的 11 个物体的多个数据集中，具有显著的性能提升。

Aug, 2015

室内三维场景的简单有效合成

研究如何从 1 或多张图像中合成逼真的室内 3D 场景，采用了基于图像的 GAN 来直接映射成高分辨率的 RGB-D 图像，及在 VLN 训练中进行空间干扰以提高成功率。

Apr, 2022

LENS: 借助 NeRF 合成增强的本地化

本文提出将新视角合成应用于机器人重定位问题，通过 NeRF 类算法所渲染的额外合成数据集，从内部表示的三维场景几何形态中选择虚拟相机位置，进一步改进了姿态回归器的定位精度，结果大幅降低了 Cambridge 地标和 7 景数据集的误差，并将精度与基于结构的方法相媲美，无需架构修改或领域适应性约束，因为该方法允许几乎无限产生训练数据，我们调查了在公共基准数据集上进行训练所使用的数据大小和分布对相机姿态回归的限制，得出结论，姿态回归精度在很大程度上受到相对较小且有偏的数据集的限制，而非姿态回归模型解决本地化任务的能力。同时，采用合成的逼真且具有几何一致性的图像进行数据增强。

Oct, 2021

基于学习的光场相机视角合成

本文提出了一种新的基于机器学习的方法用于从稀疏的视角图像中合成新的视角图像，该方法使用了两个 CNN 来分别对视差和颜色进行估计，并通过最小化合成图像与标准图像之间的误差来同时训练两个网络。实验结果表明该方法能够合成出高质量的图像并优于现有的技术，该方法可以潜在地降低消费者光场相机所需的角度分辨率，从而提高空间分辨率。

Sep, 2016

DeepStereo：从世界影像中学习预测新视角

本文提出了一种新颖的深度神经网络架构，其可直接从像素级数据对图像进行新视图综合，并通过端到端的训练实现。与传统的多阶段处理方法不同，该系统具有广泛适用性和高质量的结果，是深度学习应用于真实自然图像综合的首例研究。

Jun, 2015

通过能量耗散控制神经网络

使用能量耗散网络在深度学习中提出了迭代计算下降方向以实现图像重构、特别是对噪声图像进行去模糊，超分辨率和医学图像中来实现。经实验证明，它可以控制网络在推断时遵循数据形成模型，并且它在单幅图像超分辨率和计算机成像重构上取得了良好效果，并进一步扩展到凸可行性问题。

Apr, 2019

从合成的场景图进行的跨视图自定位

通过将原始图像的视图不变外观特征和合成图像的视图依赖空间 - 语义特征相结合，利用图神经网络进行压缩学习和识别，该方法在一个包含多个未见过视觉的交叉视图自定位数据集中得到了验证。

Oct, 2023