Mar, 2022

使用残差量化的自回归图像生成

TL;DR本文提出了一种两阶段的框架,由残差量化VAE(RQ-VAE)和RQ-Transformer组成,旨在有效地生成高分辨率图像,通过精确的逼近,我们可以将256×256像素的图像表示为8×8特征映射,并且RQ-Transformer可以在保证生成高品质图像的同时减少计算成本。