Jul, 2021

使用视觉 Transformer 训练 GANs 的 ViTGAN

TL;DR本文研究在生成对抗网络中引入 Vision Transformers (ViTs) 架构,并通过引入创新的正则化技术(ViTGAN)解决现有正则化方法与自注意力交互不良的问题,实验表明 ViTGAN 在 CIFAR-10,CelebA 和 LSUN 卧室数据集上表现不亚于基于卷积神经网络的 StyleGAN2 的最新成果。