MobileStyleGAN: 一种用于高保真图像合成的轻量级卷积神经网络
本文介绍一种基于布局和风格的生成对抗网络 [LostGANs] 的架构,能够从可重构的布局和风格中生成图像,实现了多物体样式生成,并在COCO-Stuff数据集和Visual Genome数据集上实现了最先进的性能。
Aug, 2019
使用改进的模型结构和训练方法,对StyleGAN生成器的规范化、进化成长和正则化进行了重新设计,并引入了路径长度正则化器,以改善图像质量和生成器的可逆属性。通过可视化生成器对其输出分辨率的使用情况,识别容量问题并进行大规模模型的训练,使得该模型在无条件图像建模领域中的分布质量和感知图像质量均达到了最高水平。
Dec, 2019
本文介绍一种新型的基于样式和小波变换的生成对抗网络(SWAGAN),通过在频域中实现渐进式生成,以小波为特征的潜在表示在每一步中都得到了很好的保留,从而提高了生成图像的视觉质量和计算性能。
Feb, 2021
提出了 Styleformer,这是一种基于 transformer 的 GAN 生成器,其结构不依赖于卷积操作,并修改了现有的 transformer 结构,使其生成高质量的图像,可以在 CIFAR-10 和 LSUN-church 等数据集上实现可比较的性能,并在 STL-10 和 CelebA 上实现了新的最先进水平。
Jun, 2021
通过训练一个生成器来分别对局部语义部分进行建模,控制不同区域的纹理并且实现更加细粒度的合成和编辑,SemanticStyleGAN作为具有内置解缠结的通用先验模型,可以促进基于GAN的应用程序的发展并实现更多的下游任务。
Dec, 2021
本文研究探索类似于 pure transformers 的 GAN 架构来进行高分辨率图像合成,并提出了基于 Swin transformer 和本地化的 Local Attention 的 StyleSwin 生成器。在高分辨率合成过程中,采用双重注意力机制来改善生成质量、有效地抑制块状伪影,并证明了 transformers 在高分辨率图像生成方面的可用性。
Dec, 2021
使用强大的神经网络先验和渐进增长策略,成功地在ImageNet上训练了最新的StyleGAN3生成器,创造了新的StyleGAN-XL模型,并在大规模图像合成方面取得最新的技术突破。
Feb, 2022
本文介绍了GANs和StyleGAN,讨论了其在图像合成和潜在空间方面的应用和研究趋势,强调了其生成图像编码的潜力和限制,以及视觉先验的构建和使用,同时指出了任务和目标特定的研究方向。
Feb, 2022
该研究提出了一个基于7种GAN架构、9种调节方法、4种对抗性损失以及13种正则化模块、3种可微增强方法、7种评估指标和5种评估指标的开源库StudioGAN,通过在多种数据集和三种不同的评估骨干(InceptionV3,SwAV和Swin Transformer)上训练基于BigGAN,StyleGAN2和StyleGAN3等最新生成模型的统一训练流水线中的可代表性GAN,并使用7种评估指标量化生成性能的大规模基准测评了各种前沿的生成模型,提供了预训练权重的GAN实现、训练和评估脚本。
Jun, 2022
该论文旨在使用生成对抗网络改进大规模文本到图像合成,提出了StyleGAN-T模型,它在大规模文本到图像合成中具有大容量、稳定的训练、强文本对齐和可控变化与文本对齐平衡等特点,并在样本质量和速度方面显著优于以前的生成对抗网络和蒸馏扩散模型。
Jan, 2023