潜空间应用于人脸图像局部风格操作的 Latents2Semantics
本文旨在探索利用掩码引导特征调制在深度生成模型的潜空间中解决真实图像倒置和操控方向的问题,提出了 SemanticStyle 自编码器模型,并对其进行了定性和定量分析。
Nov, 2022
本研究通过将 facial semantic ROIs 的语义划分和潜在的 Generative Autoencoder 模型相结合,实现了对面部图像语义细分的优化后任务,并在 CelebAMask-HQ 和 HELEN 数据集上展示了它比当前最先进的 works 具有更好的性能表现。
Jul, 2022
我们提出了一种自编码器方法,通过重新组织 StyleGAN 的潜空间,使我们希望编辑的每个属性对应于新潜空间的一个轴,同时确保潜空间轴之间的相关性降到最低,以促进属性解缠,通过实验证明了我们的方法在编辑能力上超越了竞争方法,同时在保持图像身份一致性方面与原始图像具有高度的准确性,我们的自编码器结构简单明了,易于实现。
Dec, 2023
本文提出了一个名为 InterFaceGAN 的新框架,用于解释 GAN 学习到的语义面部编辑,并深入研究不同语义如何编码在 GAN 的潜在空间中。我们发现,精心训练的生成模型的潜在编码实际上学习了一个分离的表示,在线性变换后解旋,通过子空间投影来解开某些绑定属性,实现更精确的面部特征控制,并产生可控的面部属性表示的结果表明 GAN 具有生成高保真图像的能力。
Jul, 2019
FLAME 是一种使用少量监督来进行操纵编辑方向的简单而有效的框架,可通过操纵潜在空间来实现高度可控的图像编辑。同时,还提出了属性样式操作的新任务,以生成具有不同属性样式的多样化图像。
Jul, 2022
该研究提出了一种基于 EPAAEs 的方法,通过在连续嵌入空间中添加一个可调整噪音组件来完善扰动模型,从而更好地聚类风格相似的句子,且在文本风格转移任务上表现优异,同时还将文本风格转移任务扩展到 NLI 数据集,并证明了该方法最适合学习具有更复杂风格的数据集。
May, 2022
本文提出使用 Semi-Latent Facial Attribute Space (SL-FAS) 和 SL-GAN 模型学习人脸图像生成和修改,通过实验验证了该模型的有效性,并提出迭代训练算法。
Apr, 2017
本文提出了一种基于变分自编码器的类别和层次的扩展方法,能够通过学习多个潜在空间在本地和全局水平上灵活地控制每个对象类别以处理确定对象样式的各种因素,生成的图像在真实数据集、合成数据集三个不同领域的广泛实验中都表现出更加合理、更具多样性的特点,可用于图像合成和编辑任务。
Jun, 2021
本研究提出通过 StyleGAN 生成器的潜在空间编辑面部属性,通过训练专门的潜在空间转换网络并在损失函数中添加显式的分离和身份保存项来控制和保护身份,并介绍了一个将面部编辑推广到视频的流程。在真实图像和视频方面表现出出色的性能。
Jun, 2021
本文提出了一种基于 StyleGAN 的自适应潜在表示学习的高分辨率人脸交换框架,通过多任务双空间人脸编码器和自适应潜在编码交换模块来实现面部感知和融合,从而提高人脸交换的真实性和广泛适用性,并证明了该方法优于现有的最先进方法。
Mar, 2023