CVPRNov, 2022

SpaText: 控制型图像生成的空间文本表示

TL;DR该论文提出了一种使用开放词汇场景控制的文本到图像生成方法 SpaText,基于 CLIP 的空间 - 文本表示方法,通过支持自由形式的自然语言描述的感兴趣区域的分割图来控制场景的布局和不同区域对象的形状。此外,该论文还提供了几种自动评估指标,并使用它们以及 FID 指标和用户研究来评估其方法,在具有自由形式文本场景控制的图像生成方面实现了最先进的结果。