从单个视频生成多样化视频

CVPRMay, 2022

Diverse Video Generation from a Single Video

Niv Haim, Ben Feinstein, Niv Granot, Assaf Shocher, Shai Bagon...

TL;DR本文提出了非参数基线方法来解决单个视频生成及操作任务，相较于传统的基于 GAN 的方法能提供更高的性能和更快的运行速度，并且在视频类比和时空重新定位等方面表现突出。

Abstract

gans are able to perform generation and manipulation tasks, trained on a single video. However, these single video gans require unreasonable amount of time to train on a single video, rendering them almost imprac

gans non-parametric baseline space-time patches-nearest-neighbors video analogies spatio-temporal retargeting

发现论文，激发创造

层次化 Patch VAE-GAN：从单一样本生成多样化视频

本文提出了一种使用基于 patch 的变分自编码器（VAE）生成多样化视频的新方法，并将其与更细节的 patch-GAN 相结合，以在保证多样性的同时生成高质量视频。实验结果表明，该方法不仅可以生成多样化的图像，还可以处理更具挑战性的视频领域。

Jun, 2020

提升多功能视频生成

本文旨在通过设计稳健的单流视频生成架构，并扩展最先进的 Wasserstein GAN 框架，从而改进视频生成对抗网络（GANs）的性能，成功地将其应用于视频着色、视频修复和未来预测等领域，实验结果表明，我们的模型在多个具有挑战性的数据集上表现优异。

Nov, 2017

时间上一致的语义视频编辑

本文提出一种简单而有效的方法来实现一致性视频编辑，通过优化潜在编码和预先训练的生成器，减少时间光度不一致，并在不同领域和 GAN 逆推技术上得到了有利的结果。

Jun, 2022

放弃 GAN：支持最近邻补丁作为单图像生成模型

本文提出了一种不需要训练的基于补丁的优化框架，比单个图像 GAN 方法快 1000~10000 倍，并产生比任何以前的方法（无论是基于 GAN 还是基于经典补丁的方法）更优越的结果和更真实的整体结构，应用广泛，如图像编辑和重塑大小。

Mar, 2021

三维感知视频生成

本文探讨了生成对抗网络 (GANs)，将神经隐式表示与时间感知区别器相结合，发展了一种 GAN 框架，仅用单目视频合成了 3D 视频，能够学习可分解的 3D 结构和运动的丰富嵌入，实现了新的时空渲染视觉效果，同时也能产生与现有 3D 或视频 GANs 相媲美的图像质量。

Jun, 2022

时光缝合：基于 GAN 的真实视频面部编辑

本文提出了一种基于对生成对抗网络的理解和神经网络学习低频功能的能力，使用 StyleGAN 对视频中的面部进行语义编辑，提高了当前最先进技术水平，实现了有意义的面部操作，保持了更高程度的时间连贯性，并可应用于高质量的 Talking Head 视频中。

Jan, 2022

采用分层 Wasserstein GAN 的逐渐增长方法，实现高分辨率视频生成

本研究提出了利用渐进生长的 GAN 模型生成高分辨率视频的方法，通过逐步增加空时卷积层训练模型，逐渐学习到空间外形和时间运动的信息。同时，作者引入 SWGAN 损失函数进行高维度视频数据的分布学习。在实验中，作者的模型取得了生成 256x256x32 分辨率逼真人脸视频的好成果，并在 UCF-101 数据集上创下记录性能。

Oct, 2018

生成视频所需的仅一种风格

本文提出了一种基于风格条件的视频生成模型，其中引入了一种基于学习的正弦基的新颖时态生成器，学习到的动态表示独立于图像内容，可以在不同的演员之间进行传递。除了显著提高视频质量相比普遍方法外，我们还证明了解离的动态和内容使它们能够进行独立操作，以及通过时态 GAN 反演从一个内容或身份中提取和传递视频动作而无需进一步的预处理，如关键点。

Oct, 2023

具有奇异值剪切的时间生成对抗网络

本文提出了一种生成式模型 Temporal Generative Adversarial Nets（TGAN），用于学习未标记视频的语义表示，并能够生成视频。我们的模型利用两种不同类型的生成器：时间生成器和图像生成器，解决了利用现有的基于 GAN 的方法生成视频时存在的问题。为了稳定训练，我们采用了最近提出的 Wasserstein GAN 模型，并提出了一种稳定的端到端训练方法。实验结果表明了我们方法的有效性。

Nov, 2016

StyleVideoGAN: 使用预训练 StyleGAN 的时间生成模型

本研究提出了一种新的视频合成方法，通过将空间域和时间域分离，利用预训练的 StyleGAN 网络的潜在空间进行训练，成功地生成了高质量的人像视频，并显著降低了所需训练数据和资源的数量。

Jul, 2021