对抗性文本到图像合成:综述
利用递归神经网络和深度卷积生成对抗网络构建了新的深度架构和GAN公式,将字符转换为像素,有效地将文本和图像建模相结合,从而实现了从详细文本描述中生成花和鸟的逼真图像的能力。
May, 2016
本文提出了一种使用自然语言描述直接合成逼真图像的方法,它有很多有用的应用,例如智能图像操作。我们提出了一种端到端的神经架构,利用对抗学习自动学习隐式损失函数,实现语义分离并生成新图像。通过在 Caltech-200 鸟类数据集和 Oxford-102 花卉数据集上进行实验,我们证明了我们的模型能够合成符合描述要求的逼真图像,同时仍保留原始图像的其他特征。
Jul, 2017
本文提出了一种新颖的方法来生成基于语义图像描述的摄影图像,并通过采用伴随的分层嵌套对抗目标函数进行中层表示规范化及生成器训练来改善图像质量,以及引入新的视觉语义相似度衡量来评估其生成的图像的语义一致性,最终在三个主流数据集上实验验证表明,该方法在各种评估指标上显著优于先前的最先进技术。
Feb, 2018
本研究提出了一种新的方法,改进了生成对抗网络(GANs)训练的能力,可以根据文本输入合成多样的图像,这种方法基于条件版本的GANs,扩展了前人利用判别器中的辅助任务,通过负样本采样来构造积极和消极的训练样例,通过牛津102花卉数据集的实验结果表明,生成的图像更具多样性,特别是当负样本逐渐靠近语义空间中的积极样本时。
Dec, 2018
该研究论文提出了一种名为 DF-GAN 的新型深度融合生成对抗网络,用于更加高效地合成与文本相匹配的高质量真实图片,并在广泛使用的数据集上取得更好的性能。
Aug, 2020
综述文章介绍了生成对抗网络(GANs)在图像合成领域的各种应用,包括图像到图像的转换、融合图像生成、标签到图像映射和文本到图像生成,并总结了基于模型、特定于架构、约束、损失函数、评估度量和培训数据集开发思路等各种领域进展和具体实现,并提出了未来发展的潜在方向。
Dec, 2020
本研究解决了从文本生成逼真图像这一计算机视觉领域的难题。通过对比五种基于生成对抗网络(GAN)的方法,本文揭示了不同模型架构在生成图像时的分辨率差异,并确定了最佳和最差的分辨率。这项研究的关键发现是识别了性能最优的模型,为文本到图像生成提供了指导。
Oct, 2024