CVPRDec, 2020

TediGAN: 基于文本引导的多样化人脸图像生成和操作

TL;DR本文提出 TediGAN 框架,用于多模态图像生成和操作。该方法包括三个组件:StyleGAN 反演模块,视觉 - 语言相似度学习和实例级优化。模型可使用多模态输入生成多样化,分辨率为 1024 的高质量图像,并提出 Multi-Modal CelebA-HQ 数据集以支持文本引导的多模态综合。经过广泛实验,本方法展现出优越性能。