通过潜空间导航的可控 GAN 用于图像编辑
本文研究如何扩展 GAN 模型可达到的视觉效果,通过在生成器参数空间中探索方向,发现了许多可解释性方向,这是非常重要的,因为这些方向可以用于语义操作,这些操作无法通过转换潜在的向量代码实现。
Nov, 2020
我们提出了一种自编码器方法,通过重新组织 StyleGAN 的潜空间,使我们希望编辑的每个属性对应于新潜空间的一个轴,同时确保潜空间轴之间的相关性降到最低,以促进属性解缠,通过实验证明了我们的方法在编辑能力上超越了竞争方法,同时在保持图像身份一致性方面与原始图像具有高度的准确性,我们的自编码器结构简单明了,易于实现。
Dec, 2023
通过在中间的潜空间使用具有空间维度的调制替换 AdaIN,我们提出了 StyleMapGAN,它使得通过编码器的嵌入比现有基于优化方法更加准确,同时保持 GAN 的属性。实验结果表明,我们的方法在各种图像操作任务中显著优于最先进的模型。
Apr, 2021
本文提出了一种基于 Transformer 的框架 TransEditor 以及新的双空间编辑和倒置策略,用于高度可控的面部编辑,实验证明该框架在图像质量和编辑能力上具有优越性。
Mar, 2022
FLAME 是一种使用少量监督来进行操纵编辑方向的简单而有效的框架,可通过操纵潜在空间来实现高度可控的图像编辑。同时,还提出了属性样式操作的新任务,以生成具有不同属性样式的多样化图像。
Jul, 2022
我们提出了一个具有明确控制 GAN 生成的图像的框架,借助于对抗性训练(GANs)、明确控制的潜在空间以及对人类的符号解释模型进行了对生成图像的控制,可扩展到人类脸谱以外的领域,实现了身份、年龄、姿态、表情、头发色彩和光照方面的控制,并且在画像和狗图像生成的领域中都展示了控制能力,同时表现出优良的定量和定性性能。
Jan, 2021
本文研究在生成模型中,利用非线性的神经 ODE 来处理非纹理变化因素,挖掘潜在编码空间中的更多属性,并对大量具有已知属性的数据集进行实证研究。
Nov, 2021
提出一种新的方法 EditGAN,通过修改高分辨率部分分割掩码来实现高质量、高精度的语义图像编辑,同时利用生成对抗网络和条件潜空间优化来实现编辑。
Nov, 2021
本研究旨在改变面部图像的一个或多个属性,并保持其他细节,使用生成敌对网络(GAN)和编码器 - 解码器架构来确保高质量的面部特征编辑。
Nov, 2017
本文提出一种能够支持 GAN 生成图像的局部编辑的有效方法,称为 LoGAN,利用内容调制,风格调制与优先级掩码来精确控制生成特征,在卧室合成等实验中展示了局部编辑图像的巨大潜力,可为多功能图像编辑提供模板。
May, 2021