CVPRFeb, 2023

实体级文本引导图像操作

TL;DR本文提出了基于文本指导的实体级别真实世界图像操纵方法 SeMani,通过语义对齐和图像操纵两个阶段,使用离散自回归生成和扩散模型连续去噪生成开发了两个版本的生成过程,对 CUB,Oxford 和 COCO 数据集进行了实验验证。