通过改进背骨网络和损失集成方法提出了 SEAttnGAN,它是一种高质量图像到文本模型,可以通过引导生成模型来提高其性能和质量。
Jun, 2023
利用递归神经网络和深度卷积生成对抗网络构建了新的深度架构和 GAN 公式,将字符转换为像素,有效地将文本和图像建模相结合,从而实现了从详细文本描述中生成花和鸟的逼真图像的能力。
May, 2016
本研究提出一种动态内存生成对抗网络(DM-GAN),用于解决现有文字生成图片方法在生成高质量图像过程中存在的问题。DM-GAN 能够更准确地从文本描述生成图像,其中一个动态内存模块被引入以完善模糊的图像内容,并通过一个内存写入门来选择重要的文本关键信息。实验结果表明,DM-GAN 模型在 Caltech-UCSD 鸟类 200 数据集和 Microsoft COCO 数据集上的性能超越了现有方法。
Apr, 2019
本文提出 StackGAN,借助生成对抗网络,通过文本生成真实的 256x256 图像,经过两个 GAN 进行图像细节加强和修复,并且引入新的条件增强技术以提高图像多样性和稳定性,并取得了重大进展。
Dec, 2016
本文提出一种改进的基于 GAN 的文本图像生成方法,通过优化感知损失函数,可以生成更具感染力、质量更高的鸟和花卉的合成图像。
Aug, 2017
该研究提出了一种通过敌对训练生成逼真文本的框架,采用了 LSTM 作为生成器,卷积网络作为判别器,并使用核距离度量匹配真实和合成句子的高维潜在特征分布,从而缓解了模式崩溃问题,并在定量评估方面表现出优越性,证明了该模型可以生成逼真的句子。
Jun, 2017
本文提出了一种新的动态语义演化生成对抗网络(DSE-GAN),采用单个生成器 - 鉴别器对的单个对抗训练架构,在每个阶段根据历史阶段的状态(即历史阶段的文本和图像特征)对文本特征进行自适应重新组合,以在粗到细的生成过程中提供多样化和准确的语义引导。在广泛使用的 CUB-200 和 MSCOCO 数据集上,实验结果表明该模型相对 FID 分别提高 7.48%和 37.8%。
Sep, 2022
本文提出了堆叠式生成式对抗网络 (Stackgan),该网络采用两个阶段和多个生成器和判别器构成的树状结构,用于高分辨率、逼真的图像生成。经过大量实验验证,该网络在生成逼真图像方面表现优于其他方法。
Oct, 2017
本文提出了一种渐进式精炼生成对抗网络 (GR-GAN) 用于高效解决生成图像与文本约束的一致性问题;包括 GRG 模块,ITM 模块以及新指标 CMD 的引入,并在实验中表现出了显著的优势。
May, 2022
该论文旨在使用生成对抗网络改进大规模文本到图像合成,提出了 StyleGAN-T 模型,它在大规模文本到图像合成中具有大容量、稳定的训练、强文本对齐和可控变化与文本对齐平衡等特点,并在样本质量和速度方面显著优于以前的生成对抗网络和蒸馏扩散模型。
Jan, 2023