通过观看视频学习可变形三维物体的 DOVE 模型

Jul, 2021

通过观看视频学习可变形三维物体的 DOVE 模型

DOVE: Learning Deformable 3D Objects by Watching Videos

Shangzhe Wu, Tomas Jakab, Christian Rupprecht, Andrea Vedaldi

TL;DRDOVE 是一种用于从单目视频中学习可变形物体纹理 3D 模型的方法，无需关键点、视点或模板形状监督，并利用视频中的时间对应关系和对称性消除姿态歧义，将三维形状、艺术姿势和纹理从每个单独的 RGB 帧中分离出来。

Abstract

Learning deformable 3D objects from 2D images is often an ill-posed problem. Existing methods rely on explicit supervision to establish multi-view correspondences, such as template shape models and keypoint annotations, which restricts their applicability on objects "in the wild". A more natural way of establishing correspondences is by watching videos of ob

deformable objects 3d modeling monocular videos shape supervision texture mapping

发现论文，激发创造

通过 3D 模型估计跟踪未知视频对象

本文提出一种新的方法，在视觉目标追踪方面通过 3D 形态和位姿表达，结合可微分渲染技术优化一个新型的损失函数，取得了在三个数据集上追踪刚性物体方面的最新进展。

Apr, 2023

通过观察学习 3D 物体类别

本篇论文旨在通过两种创新，基于从运动视角观察物体的方式，不需要手动注释，实现学习 3D 物体类别的传统方法。我们的系统基于两种创新：一种是具有鲁棒性的 Siamese 视点因子分解网络，可以对不同的视频进行对齐；另一种是可以从部分观测中提取对象的完整形状的 3D 形状完成网络。我们还演示了配置网络以执行概率预测和几何感知数据增强方案的好处。在公开可用的基准测试中，我们获得了最先进的结果。

May, 2017

从野外视频中学习手持物体重建

本文介绍了一种通过采用从野外视频数据中提取的三维监督来重建手持物体的方法，并使用数据驱动的三维形状先验进行训练，结果表明这种间接的三维监督信号可以在没有直接现实世界三维监督的情况下有效地预测真实世界中的手持物体的三维形状。

May, 2023

从运动学习骨骼类目的单目三维重建

使用视频自监督和模板形变技术来实现单目 3D 重建并且进行数值优化，以便使计算得出的模型更加准确和具有解释性。

Mar, 2021

野外一致网格重建的在线适应

本文提出了一种算法，用于从野外视频中重建变形对象实例的时间一致 3D 网格，不需要每个视频帧的 3D 网格注释，2D 关键点或相机姿态，而是将基于视频的重建构建为适用于任何传入测试视频的自监督在线适应问题。

Dec, 2020

DO3D: 自监督学习单目视频的分解目标感知 3D 运动和深度

提出了一种自监督方法，可以从单目视频中联合学习 3D 运动和深度。通过利用深度和运动网络相互协作来准确建模现实场景的几何和动态，进而改进了深度估计和 3D 动作估计的性能。

Mar, 2024

野外视频中的 3D 物体类别的无监督学习

本篇论文针对计算机视觉中难以标注真实数据的实际场景，提出一种基于多视角的物体三维重建模型，利用自主采集的物体图像视频数据集作为训练样本，创新地提出使用神经网络设计进行后续重构，并在多项基准数据集上验证了该模型的优越性。

Mar, 2021

通用场景下基于图像的 3D 非刚性对称物体无监督学习

本文提出了一种无需外部监督学习从单视角图像中学习三维可变形物体类别的方法，该方法基于自编码器，将每个输入图像分解为深度、漫反射、观察角度和光照，通过利用物体对称结构来分解这些组件，推理光照使我们能够利用底层的物体对称性，即使外观不对称，而是由于阴影造成的。此外，我们通过预测对称概率地图来建模可能但不一定对称的对象，该地图与模型的其他组件一起端到端地学习。我们的实验表明，这种方法可以从单视角图像中非常准确地恢复人类脸部、猫脸和汽车的三维形状，而不需要任何监督或先前的形状模型。与使用 2D 图像对应的监督方法相比，在基准测试中，我们表现出优越的准确性。

Nov, 2019

从未标注的立体视频中学习独立的物体运动

该论文提出了一个从立体视频中学习独立移动物体动作的系统，该系统使用的唯一人工注释是 2D 物体边界框，并从中引入了对象的概念。与以前的基于学习的工作不同，该工作集中于预测每个图像的密集像素光流场和 / 或深度图，我们提出了从物体实例特定的 3D 场景流图和实例掩模预测来推断每个物体实例的运动方向和速度的方法，并且我们的网络考虑了问题的 3D 几何，允许它相关输入图像。我们进行了实验，评估了我们的 3D 流向量、深度图和投影的 2D 光流的精度，在这些实验中，我们联合学习的系统优于先前独立训练每个任务的方法。

Jan, 2019

DreaMo: 从单个非正式视频进行关节 3D 重建

本研究提出了 DreaMo，一种从单个且视角覆盖不完整的网络视频中重建关节 3D 形状的方法，通过使用条件视图扩散先验和一些定制的正则化方法解决了低视角覆盖区域带来的挑战，并引入了骨架生成策略生成可解释的人体骨架。对自行收集的视角覆盖不完整的网络视频进行了广泛的定性和定量研究，结果表明 DreaMo 在新视角渲染、详细关节形状重建和骨架生成方面具有良好的质量，并且现有的方法由于视角覆盖不完整而无法解决正确的几何问题。

Dec, 2023