潜空间应用于人脸图像局部风格操作的 Latents2Semantics

AAAIDec, 2023

潜空间应用于人脸图像局部风格操作的 Latents2Semantics

Latents2Semantics: Leveraging the Latent Space of Generative Models for Localized Style Manipulation of Face Images

Snehal Singh Tomar, A.N. Rajagopalan

TL;DR利用 Latents2Semantics 自编码器模型实现人脸图像中具有高度局部化编辑风格属性的 ROI 的结构保持风格编辑，并避免了传统风格编辑流程中需要额外的人为监督的问题。

Abstract

With the metaverse slowly becoming a reality and given the rapid pace of developments toward the creation of digital humans, the need for a principled →

metaverse style editing latents2semantics autoencoder face images digital humans

发现论文，激发创造

探索基于遮罩引导的特征调制作为实现真实图像局部风格编辑机制的有效性

本文旨在探索利用掩码引导特征调制在深度生成模型的潜空间中解决真实图像倒置和操控方向的问题，提出了 SemanticStyle 自编码器模型，并对其进行了定性和定量分析。

Nov, 2022

Latents2Segments：分离生成模型的潜在空间，用于面部图像的语义分割

本研究通过将 facial semantic ROIs 的语义划分和潜在的 Generative Autoencoder 模型相结合，实现了对面部图像语义细分的优化后任务，并在 CelebAMask-HQ 和 HELEN 数据集上展示了它比当前最先进的 works 具有更好的性能表现。

Jul, 2022

图像编辑的紧凑且语义潜空间的解缠和可控

我们提出了一种自编码器方法，通过重新组织 StyleGAN 的潜空间，使我们希望编辑的每个属性对应于新潜空间的一个轴，同时确保潜空间轴之间的相关性降到最低，以促进属性解缠，通过实验证明了我们的方法在编辑能力上超越了竞争方法，同时在保持图像身份一致性方面与原始图像具有高度的准确性，我们的自编码器结构简单明了，易于实现。

Dec, 2023

基于 GAN 的潜空间在人脸语义编辑中的应用解释

本文提出了一个名为 InterFaceGAN 的新框架，用于解释 GAN 学习到的语义面部编辑，并深入研究不同语义如何编码在 GAN 的潜在空间中。我们发现，精心训练的生成模型的潜在编码实际上学习了一个分离的表示，在线性变换后解旋，通过子空间投影来解开某些绑定属性，实现更精确的面部特征控制，并产生可控的面部属性表示的结果表明 GAN 具有生成高保真图像的能力。

Jul, 2019

潜空间中拥有所有：StyleGAN 隐空间探索实现属性编辑和样式操作

FLAME 是一种使用少量监督来进行操纵编辑方向的简单而有效的框架，可通过操纵潜在空间来实现高度可控的图像编辑。同时，还提出了属性样式操作的新任务，以生成具有不同属性样式的多样化图像。

Jul, 2022

无监督文本风格转移的鲁棒和语义组织潜在表示

该研究提出了一种基于 EPAAEs 的方法，通过在连续嵌入空间中添加一个可调整噪音组件来完善扰动模型，从而更好地聚类风格相似的句子，且在文本风格转移任务上表现优异，同时还将文本风格转移任务扩展到 NLI 数据集，并证明了该方法最适合学习具有更复杂风格的数据集。

May, 2022

半潜变分生成对抗网络：通过属性学习生成和修改人脸图像

本文提出使用 Semi-Latent Facial Attribute Space (SL-FAS) 和 SL-GAN 模型学习人脸图像生成和修改，通过实验验证了该模型的有效性，并提出迭代训练算法。

Apr, 2017

基于类别和层次的 VAEs 实现多样化语义图像合成和编辑

本文提出了一种基于变分自编码器的类别和层次的扩展方法，能够通过学习多个潜在空间在本地和全局水平上灵活地控制每个对象类别以处理确定对象样式的各种因素，生成的图像在真实数据集、合成数据集三个不同领域的广泛实验中都表现出更加合理、更具多样性的特点，可用于图像合成和编辑任务。

Jun, 2021

面部图像和视频的解缩聚变换器

本研究提出通过 StyleGAN 生成器的潜在空间编辑面部属性，通过训练专门的潜在空间转换网络并在损失函数中添加显式的分离和身份保存项来控制和保护身份，并介绍了一个将面部编辑推广到视频的流程。在真实图像和视频方面表现出出色的性能。

Jun, 2021

自适应潜在表示学习下的端到端人脸交换

本文提出了一种基于 StyleGAN 的自适应潜在表示学习的高分辨率人脸交换框架，通过多任务双空间人脸编码器和自适应潜在编码交换模块来实现面部感知和融合，从而提高人脸交换的真实性和广泛适用性，并证明了该方法优于现有的最先进方法。

Mar, 2023