ICCVAug, 2023
学习生成语义布局以实现文本到图像综合中更高的文本 - 图像对应性
Learning to Generate Semantic Layouts for Higher Text-Image Correspondence in Text-to-Image Synthesis
Minho Park, Jooyeol Yun, Seunghwan Choi, Jaegul Choo
TL;DR通过利用可用的语义布局,我们提出了一种增强文本 - 图像对应关系的新方法。具体而言,我们提出了一种高斯 - 分类扩散过程,同时生成图像和相应的布局对。我们的实验证明,通过训练模型为每个像素生成语义标签,我们可以引导文本 - 图像生成模型意识到不同图像区域的语义,从而达到比现有方法更高的文本 - 图像对应关系。