SVG：通过去噪帧矩阵生成 3D 立体视频

Jun, 2024

SVG：通过去噪帧矩阵生成 3D 立体视频

SVG: 3D Stereoscopic Video Generation via Denoising Frame Matrix

Peng Dai, Feitong Tan, Qiangeng Xu, David Futschik, Ruofei Du...

TL;DR使用现成的单目视频生成模型，我们提出了一种无姿态、无需训练的方法来生成 3D 立体视频，并采用了新颖的帧矩阵视频修复框架。我们的方法利用估计的视频深度将生成的单目视频变形为立体基线上的摄像机视图，并使用视频生成模型对观察到的不同时间戳和视图的帧进行修复。通过减轻潜在空间中从不可遮挡区域传播的负面影响，我们还开发了一种去遮挡边界再注入方案来进一步提高视频修复的质量。我们对包括 Sora、Lumiere、WALT 和 Zeroscope 等各种生成模型的视频进行了实验证明我们提出的方法在之前的方法基础上具有显著的改进。

Abstract

video generation models have demonstrated great capabilities of producing impressive monocular videos, however, the generation of 3d stereoscopic video remains under-explored. We propose a pose-free and training-

video generation 3d stereoscopic video pose-free approach video inpainting disocclusion boundary re-injection

发现论文，激发创造

隐形缝合：使用深度修复生成平滑的 3D 场景

基于 2D 生成扩散模型的进展，我们在三维场景生成领域做出两个基本贡献：首先，通过引入新型深度完成模型学习三维融合过程，提高场景的几何一致性；其次，基于真实几何关系引入新的场景生成方法基准系统，用于评估场景结构的质量。

Apr, 2024

VideoMV：基於大型視頻生成模型的一致多視角生成

使用来自视频生成模型的图像，通过引入一种新的框架以及 3D 感知降噪采样策略，可以更快速地生成密集视图，提高图像的质量和一致性。

Mar, 2024

三维感知视频生成

本文探讨了生成对抗网络 (GANs)，将神经隐式表示与时间感知区别器相结合，发展了一种 GAN 框架，仅用单目视频合成了 3D 视频，能够学习可分解的 3D 结构和运动的丰富嵌入，实现了新的时空渲染视觉效果，同时也能产生与现有 3D 或视频 GANs 相媲美的图像质量。

Jun, 2022

2L3: 将不完美生成的 2D 图像提升到精确的 3D

通过利用内在分解指导、瞬态 - 单模先验指导和视图增强来解决光照不一致、几何不对齐和视图稀疏等问题，我们提出了一种新的 3D 重构框架，该框架能够将多视图图像生成与神经网络基于体积有符号距离函数的单一图像到 3D 对象重建相结合。在各种数据集上评估我们的方法，并在定量和定性评估中展示了其卓越性能，从而在 3D 物体重建方面取得了显著的进展。与最新的最先进方法 Syncdreamer 相比，我们将 Chamfer 距离误差降低了约 36％，将 PSNR 提高了约 30％。

Jan, 2024

动态场景深度预测的 Web 立体视频监督

利用全数据驱动的方法计算深度，通过对非刚性场景开发一种新数据集，其中包括大量的非刚性对象，特别是人，提出了一种损失函数进行深度预测，评估方法并表明该方法对自然场景具有更好的泛化能力。

Apr, 2019

从宽基线立体对学习生成新视角

介绍了一种用于单个广角立体图像对的新视角合成的方法，包括 3D 场景重构和外观变化的先验模型，提出了一种多视角变换编码器、图像上的极线采样方案和轻量级交叉注意力渲染器，通过大规模实际数据集的训练，证明了模型学习到了强大的多视角几何先验，大大缩短了渲染时间，并在两个实际数据集上得到了显著的优越性能。

Apr, 2023

DreamScene4D: 从单目视频生成动态多物体场景

DreamScene4D 是一种能够从野外单眼视频中生成多个物体的三维动态场景的方法，通过设计 “分解 - 重组” 方案，将视频场景及每个物体的三维运动进行分解，并使用开放词汇遮罩跟踪和适应性图像扩散模型对视频中的物体和背景进行分割、追踪和完整修复。

May, 2024

MVD-Fusion: 单视角 3D 通过深度一致的多视角生成

通过对多视角一致的 RGB-D 图像进行生成建模，我们提出了 MVD-Fusion：一种用于通过单视角推理 3D 的方法。

Apr, 2024

解耦动态单目视频以进行动态视角合成

通过无监督学习方法，提出了一种基于分解动态物体运动和相机运动的动态视图合成方法，包括非监督表面一致性和基于路径的多视图约束，可实现准确的 3D 运动建模，从而提高合成质量并相比现有方法精确地生成场景流和深度

Apr, 2023

PV3D：肖像视频生成的三维生成模型

PV3D 提出了第一种生成性框架，它可以合成多视角一致的肖像视频，通过添加多个运动层构建运动生成器来引入运动动态，并提出了简单而有效的摄像机条件策略，能够支持许多下游应用，如动画静态肖像和视角一致的视频运动编辑。

Dec, 2022