Feb, 2022

MaskGIT: 掩码生成式图像转换器

TL;DR本文提出了一种新的图像合成模型 ——MaskGIT,采用双向 transformer 解码器,通过学习预测随机遮罩的 tokens 并在推理时同时生成全部 tokens,迭代地改进图像以获得高保真度和高分辨率的生成图像,并在 ImageNet 数据集上优于现有模型,同时通过自回归解码加速达到 64 倍,还可轻松扩展到各种图像编辑任务中。