Apr, 2021

VideoGPT: 使用 VQ-VAE 和 Transformers 生成视频

TL;DRVideoGPT 是一种简单的架构,利用 VQ-VAE 学习离散化的原始视频的下采样离散潜在表示,并使用类似于 GPT 的简单架构来自回归地模拟其离散潜在分布,以帮助生成高保真的自然视频。