CVPRMar, 2022

使用残差量化的自回归图像生成

TL;DR本文提出了一种两阶段的框架,由残差量化 VAE(RQ-VAE)和 RQ-Transformer 组成,旨在有效地生成高分辨率图像,通过精确的逼近,我们可以将 256×256 像素的图像表示为 8×8 特征映射,并且 RQ-Transformer 可以在保证生成高品质图像的同时减少计算成本。