通过利用可用的语义布局,我们提出了一种增强文本 - 图像对应关系的新方法。具体而言,我们提出了一种高斯 - 分类扩散过程,同时生成图像和相应的布局对。我们的实验证明,通过训练模型为每个像素生成语义标签,我们可以引导文本 - 图像生成模型意识到不同图像区域的语义,从而达到比现有方法更高的文本 - 图像对应关系。
Aug, 2023
本研究提出了一种从文本提示中合成与之语义对齐的高保真度图像的方法,采用了粗到细的范式来实现布局规划和图像生成,并通过粒度不同的目标交互扩散方法以优于现有方法的方式生成布局和图像。
该文提出了一种新的文本图像生成模型,使用基于语义的标准化处理和图像嵌入策略来实现高水平的语义一致性和低水平的语义多样性,并在 CUB 和 MS-COCO 数据集上展示了其优异性能。
Apr, 2019
利用大型语言模型作为布局生成器,改进了文本到图像生成模型,通过生成合理的对象布局来增强图像的构图和空间准确性,从而提高了图像质量。
Nov, 2023
本文提出了一种新颖的方法来生成基于语义图像描述的摄影图像,并通过采用伴随的分层嵌套对抗目标函数进行中层表示规范化及生成器训练来改善图像质量,以及引入新的视觉语义相似度衡量来评估其生成的图像的语义一致性,最终在三个主流数据集上实验验证表明,该方法在各种评估指标上显著优于先前的最先进技术。
Feb, 2018
通过语义一致性合成、视觉显著性确定和自适应文本外观模型等三个创新设计,提出了一种新的图像合成技术,用于生成大量标注数据,以用于训练准确和稳健的场景文本检测和识别模型。五个公共数据集的实验证明了该技术在训练精确和稳健的场景文本检测和识别模型方面的卓越性能。
Jul, 2018
该研究提出了一种高分辨率稀疏注意力模块和一个生成器架构,可以在语义标签映射的基础上,有效地实现将输入图像的视觉细节转移至新布局。实验证明,该方法在图像修补和布局操作方面的性能得到了大幅提高。
Dec, 2020
提出利用语义布局来综合生成逼真图像的新方法,该方法建立了区域之间的依赖关系并通过动态加权网络实现,既保留了语义区分,同时加强了语义相关性,提高了全局结构和细节的合成质量。
Sep, 2021
该论文介绍了一种基于生成式对抗网络的图像生成方法,引入了一种简单有效的语义 - 空间感知块,学习语义自适应变换,并在弱监督方式下学习语义掩膜,从而在保持视觉保真度的同时,能够对输入文本精准对齐。
Apr, 2021
本论文提出了一种基于结构化语义布局的图像操作分层框架,使用户可以通过添加、删除和移动一个边界框来对图像进行对象级别的操作。实验证明,该分层框架可以在语义对象操作、交互式图像编辑和数据驱动的图像操作等方面带来优势。
Aug, 2018