SWAGAN:一种基于样式波纹驱动的生成模型
使用改进的模型结构和训练方法,对StyleGAN生成器的规范化、进化成长和正则化进行了重新设计,并引入了路径长度正则化器,以改善图像质量和生成器的可逆属性。通过可视化生成器对其输出分辨率的使用情况,识别容量问题并进行大规模模型的训练,使得该模型在无条件图像建模领域中的分布质量和感知图像质量均达到了最高水平。
Dec, 2019
本文文献是关于生成对抗网络(GAN)框架及其在视觉合成领域的应用和算法进行概述,包括图像翻译、处理、合成高分辨率照片等,并讨论其在内容创作中的应用。
Aug, 2020
本篇论文的研究目的是探讨如何在边缘设备上使用风格生成网络,并引入MobileStyleGAN结构,其参数量和计算复杂度分别为StyleGAN2的1/3.5和1/9.5,同时提供可比较的生成质量。
Apr, 2021
本文研究探索类似于 pure transformers 的 GAN 架构来进行高分辨率图像合成,并提出了基于 Swin transformer 和本地化的 Local Attention 的 StyleSwin 生成器。在高分辨率合成过程中,采用双重注意力机制来改善生成质量、有效地抑制块状伪影,并证明了 transformers 在高分辨率图像生成方面的可用性。
Dec, 2021
使用强大的神经网络先验和渐进增长策略,成功地在ImageNet上训练了最新的StyleGAN3生成器,创造了新的StyleGAN-XL模型,并在大规模图像合成方面取得最新的技术突破。
Feb, 2022
本文介绍了GANs和StyleGAN,讨论了其在图像合成和潜在空间方面的应用和研究趋势,强调了其生成图像编码的潜力和限制,以及视觉先验的构建和使用,同时指出了任务和目标特定的研究方向。
Feb, 2022
该研究提出了一个基于7种GAN架构、9种调节方法、4种对抗性损失以及13种正则化模块、3种可微增强方法、7种评估指标和5种评估指标的开源库StudioGAN,通过在多种数据集和三种不同的评估骨干(InceptionV3,SwAV和Swin Transformer)上训练基于BigGAN,StyleGAN2和StyleGAN3等最新生成模型的统一训练流水线中的可代表性GAN,并使用7种评估指标量化生成性能的大规模基准测评了各种前沿的生成模型,提供了预训练权重的GAN实现、训练和评估脚本。
Jun, 2022
该论文旨在使用生成对抗网络改进大规模文本到图像合成,提出了StyleGAN-T模型,它在大规模文本到图像合成中具有大容量、稳定的训练、强文本对齐和可控变化与文本对齐平衡等特点,并在样本质量和速度方面显著优于以前的生成对抗网络和蒸馏扩散模型。
Jan, 2023
本文提出了一种新的GAN架构GigaGAN,用于文本到图像合成,并比较了其与传统的GANs和DALL-E2的性能,结果表明GigaGAN可以快速且高质量地合成高分辨率图像。
Mar, 2023
生成对抗网络(GANs)是在多个领域中生成逼真、多样化数据的强大工具。本研究综述了GANs的潜在架构、验证指标和应用领域,并探讨了GAN与Jensen-Shannon散度之间的深刻联系以及GAN框架的最优性特征。对GAN变体的效率、模型架构以及训练障碍和解决方案进行了评估,并详细讨论了GAN与Transformer、物理信息神经网络、大型语言模型和扩散模型等新开发的深度学习框架的整合。最后,揭示了该领域的若干问题和未来研究方向。
Aug, 2023