层次化文本图像合成的语义布局推断

CVPRJan, 2018

层次化文本图像合成的语义布局推断

Inferring Semantic Layout for Hierarchical Text-to-Image Synthesis

Seunghoon Hong, Dingdong Yang, Jongwook Choi, Honglak Lee

TL;DR本文提出一种新的基于语义布局的文本到图像的分层方法，通过语义布局生成器和图像生成器将生成过程分解为多个步骤完成，能够提高图像质量和与输入文本的语义对齐性。

Abstract

We propose a novel hierarchical approach for text-to-image synthesis by inferring semantic layout. Instead of learning a direct mapping from text to image, our algorithm decomposes the generation process into mul

text-to-image synthesis semantic layout layout generator image generator ms-coco dataset

发现论文，激发创造

学习生成语义布局以实现文本到图像综合中更高的文本 - 图像对应性

通过利用可用的语义布局，我们提出了一种增强文本 - 图像对应关系的新方法。具体而言，我们提出了一种高斯 - 分类扩散过程，同时生成图像和相应的布局对。我们的实验证明，通过训练模型为每个像素生成语义标签，我们可以引导文本 - 图像生成模型意识到不同图像区域的语义，从而达到比现有方法更高的文本 - 图像对应关系。

Aug, 2023

LayoutLLM-T2I: 从 LLM 中引导布局为文本到图像生成

本研究提出了一种从文本提示中合成与之语义对齐的高保真度图像的方法，采用了粗到细的范式来实现布局规划和图像生成，并通过粒度不同的目标交互扩散方法以优于现有方法的方式生成布局和图像。

Aug, 2023

文本到图像生成的语义分离

该文提出了一种新的文本图像生成模型，使用基于语义的标准化处理和图像嵌入策略来实现高水平的语义一致性和低水平的语义多样性，并在 CUB 和 MS-COCO 数据集上展示了其优异性能。

Apr, 2019

推导出您的布局：从大型语言模型中归纳出用于文本到图像合成的布局模式

利用大型语言模型作为布局生成器，改进了文本到图像生成模型，通过生成合理的对象布局来增强图像的构图和空间准确性，从而提高了图像质量。

Nov, 2023

具有分层嵌套对抗网络的照片到图像合成

本文提出了一种新颖的方法来生成基于语义图像描述的摄影图像，并通过采用伴随的分层嵌套对抗目标函数进行中层表示规范化及生成器训练来改善图像质量，以及引入新的视觉语义相似度衡量来评估其生成的图像的语义一致性，最终在三个主流数据集上实验验证表明，该方法在各种评估指标上显著优于先前的最先进技术。

Feb, 2018

逼真图像合成用于准确识别场景中的文本

通过语义一致性合成、视觉显著性确定和自适应文本外观模型等三个创新设计，提出了一种新的图像合成技术，用于生成大量标注数据，以用于训练准确和稳健的场景文本检测和识别模型。五个公共数据集的实验证明了该技术在训练精确和稳健的场景文本检测和识别模型方面的卓越性能。

Jul, 2018

高分辨率稀疏注意力下的语义布局操作

该研究提出了一种高分辨率稀疏注意力模块和一个生成器架构，可以在语义标签映射的基础上，有效地实现将输入图像的视觉细节转移至新布局。实验证明，该方法在图像修补和布局操作方面的性能得到了大幅提高。

Dec, 2020

语义合成图像

提出利用语义布局来综合生成逼真图像的新方法，该方法建立了区域之间的依赖关系并通过动态加权网络实现，既保留了语义区分，同时加强了语义相关性，提高了全局结构和细节的合成质量。

Sep, 2021

具有语义 - 空间感知的 GAN 图像生成

该论文介绍了一种基于生成式对抗网络的图像生成方法，引入了一种简单有效的语义 - 空间感知块，学习语义自适应变换，并在弱监督方式下学习语义掩膜，从而在保持视觉保真度的同时，能够对输入文本精准对齐。

Apr, 2021

通过结构化表示学习分层语义图像处理

本论文提出了一种基于结构化语义布局的图像操作分层框架，使用户可以通过添加、删除和移动一个边界框来对图像进行对象级别的操作。实验证明，该分层框架可以在语义对象操作、交互式图像编辑和数据驱动的图像操作等方面带来优势。

Aug, 2018