Oct, 2024
基于生成对抗网络的文本到图像生成
Text-To-Image with Generative Adversarial Networks
TL;DR本研究解决了从文本生成逼真图像这一计算机视觉领域的难题。通过对比五种基于生成对抗网络(GAN)的方法,本文揭示了不同模型架构在生成图像时的分辨率差异,并确定了最佳和最差的分辨率。这项研究的关键发现是识别了性能最优的模型,为文本到图像生成提供了指导。
Abstract
Generating realistic images from human texts is one of the most challenging problems in the field of Computer Vision (CV). The meaning of descriptions given can be roughly reflected by existing Text-to-Image appr
发现论文,激发创造
生成对抗文本到图像的合成
利用递归神经网络和深度卷积生成对抗网络构建了新的深度架构和GAN公式,将字符转换为像素,有效地将文本和图像建模相结合,从而实现了从详细文本描述中生成花和鸟的逼真图像的能力。
May, 2016
使用堆叠生成对抗网络实现文本到逼真图像的合成
本文提出StackGAN,借助生成对抗网络,通过文本生成真实的256x256图像,经过两个GAN进行图像细节加强和修复,并且引入新的条件增强技术以提高图像多样性和稳定性,并取得了重大进展。
Dec, 2016
具有分层嵌套对抗网络的照片到图像合成
本文提出了一种新颖的方法来生成基于语义图像描述的摄影图像,并通过采用伴随的分层嵌套对抗目标函数进行中层表示规范化及生成器训练来改善图像质量,以及引入新的视觉语义相似度衡量来评估其生成的图像的语义一致性,最终在三个主流数据集上实验验证表明,该方法在各种评估指标上显著优于先前的最先进技术。
Feb, 2018
DM-GAN: 动态记忆生成对抗网络用于文本到图像合成
本研究提出一种动态内存生成对抗网络(DM-GAN),用于解决现有文字生成图片方法在生成高质量图像过程中存在的问题。DM-GAN 能够更准确地从文本描述生成图像,其中一个动态内存模块被引入以完善模糊的图像内容,并通过一个内存写入门来选择重要的文本关键信息。实验结果表明,DM-GAN 模型在 Caltech-UCSD 鸟类 200 数据集和 Microsoft COCO 数据集上的性能超越了现有方法。
Apr, 2019
DF-GAN: 一个简单有效的文本到图像合成基线
该研究论文提出了一种名为 DF-GAN 的新型深度融合生成对抗网络,用于更加高效地合成与文本相匹配的高质量真实图片,并在广泛使用的数据集上取得更好的性能。
Aug, 2020
GR-GAN: 逐步细化的文本到图像生成
本文提出了一种渐进式精炼生成对抗网络 (GR-GAN) 用于高效解决生成图像与文本约束的一致性问题;包括 GRG 模块,ITM 模块以及新指标 CMD 的引入,并在实验中表现出了显著的优势。
May, 2022