- 自适应潜在表示学习下的端到端人脸交换
本文提出了一种基于 StyleGAN 的自适应潜在表示学习的高分辨率人脸交换框架,通过多任务双空间人脸编码器和自适应潜在编码交换模块来实现面部感知和融合,从而提高人脸交换的真实性和广泛适用性,并证明了该方法优于现有的最先进方法。
- CVPR稳健的无监督 StyleGAN 图像修复
本文提出了一种基于 GAN 的图像去噪、增强方法,引入了 3 个阶段渐进式潜空间扩展和保守优化器,使该方法对于多种不同水平的退化具有鲁棒性,效果比其他基于 StyleGAN 和扩散方法的方法更好。
- AAAIContraFeat: 对比深度特征用于语义发现
本文提出了一个通过关注导航模块和特征变化的损失函数完成的自动化方法,用于简化 StyleGAN 上的语义发现方法,实现了最先进的语义发现性能。
- QC-StyleGAN -- 品质可控的图像生成与操作
本文提出了一种新的 GAN 结构 QC-StyleGAN,可以控制生成图像的质量以及处理低质量图像,包括去噪、去模糊、去压缩等。其基于 StyleGAN 家族模型,可以实现图像剪裁、转移、插值等应用。
- CVPR局部 GAN 反演实现精细面部交换
本研究提出了一种基于 ' 编辑以交换 ' 范式的人脸真实交换框架,通过局部和全局交换面部特征和用户指定的部分交换控制,实现了面部几何和纹理细节的高保真性保留,同时应用了多项技术包括分离面部构件的纹理和形状信息、利用区域 GAN 反演的联合编 - 人脸交换作为一种简单的算术操作
该研究提出了一种名为‘算术脸替换’的新型高保真脸部交换方法,通过明确把预训练的 StyleGAN 的中间潜空间 W + 进行‘身份’和‘风格’子空间的解离,将人脸替换视为 W + 中的简单算术运算。作者通过学习一个神经网络将潜向量映射到‘风 - 使用去噪扩散和 CLIP 对预训练 StyleGAN 进行文本驱动采样
引入了一种新的方法,可以从预训练的 CLIP 和 StyleGAN 中高效创建文本到图像模型,无需外部数据或微调。通过训练一个基于 CLIP 嵌入的扩散模型以对预先训练的 StyleGAN 的潜在向量进行采样,我们称之为 clip2late - ECCV在精简 StyleGAN 时要注意差距
这篇论文提出了一种基于输出一致性和潜在空间的语义关系的潜在方向的蒸馏方法,以解决 StyleGAN 的蒸馏问题,该方法在蒸馏 StyleGAN2 和 StyleGAN3 方面的效果显著优于现有的 GAN 蒸馏方法。
- MM通过 CLIP 实现反事实图像处理
通过 Contrastive-Language-Image- Pretraining (CLIP) 进行对抗操作,利用预定义的 CLIP 空间方向指导编辑,并将文本嵌入显式地转换为潜在空间,以实现准确的编码和编辑。
- CVPR超参数化改进 StyleGAN 逆转
本文提出了一种通过对 StyleGAN 模型的先验空间进行过度参数化以增加模型自由度,从而实现更好的图像重建和编辑能力的方法。
- CVPR修复噪音:解开 StyleGAN 迁移学习中源特征的混合
本文提出了一种新的方法,通过引入简单的特征匹配损失来提高生成图像的质量,借助于分解的特征空间,我们提出的 FixNoise 策略可在单个模型中平滑地控制源特征的程度,实验表明,相比于以往的方法,该方法能够生成更具一致性和真实性的图像。
- StyleGAN-Human: 人类生成的数据中心之旅
本研究从数据工程的角度出发,收集并注释了一个大规模人类图像数据集,并通过实验研究了数据量、数据分布和数据对齐等因素对 StyleGAN 生成高保真无条件人类图像的影响。结果显示,需要超过 40K 的大规模数据来训练高保真的 StyleGAN - 声音引导下的语义视频生成
本文提出了一种利用多模态(声音 - 图像 - 文本)嵌入空间生成逼真视频的框架,通过将声音和 StyleGAN 潜空间相结合生成一个语义上和声音一致的视频,并且在视频质量和编辑方面超过了现有的最先进方法。
- CVPR基于风格的全局外观流应用于虚拟试衣
本文提出了一种新的全局外观流估计模型,并引入流精炼模块,以处理针对带有 “流浪” 挑战的全身参考图像的虚拟试穿。
- MyStyle: 个性化生成先验
本文介绍了 MyStyle,这是一种使用少量照片训练的个性化深度生成先验的方法,其可以重建、增强和编辑特定人物的图像,生成的图像忠实于人物的关键面部特征。通过少量照片我们可以调整预训练的 StyleGAN 面部生成器的权重,形成一个本地的、 - CVPRTransEditor: 一种基于 Transformer 的双空间 GAN 用于高度可控的人脸编辑
本文提出了一种基于 Transformer 的框架 TransEditor 以及新的双空间编辑和倒置策略,用于高度可控的面部编辑,实验证明该框架在图像质量和编辑能力上具有优越性。
- CVPR图像倒置和编辑的风格变换器
本文介绍了一种基于 Transformer 的图像逆转和编辑模型,用于预先训练过的 StyleGAN,通过 CNN 编码器在多个尺度上提供图像特征作为键和值,并将样式代码视为查询,以在生成器中反转输入。无论是在逆转还是编辑任务中,该方法在 - StyleGAN 架构、方法与应用的最新技术
本文介绍了 GANs 和 StyleGAN,讨论了其在图像合成和潜在空间方面的应用和研究趋势,强调了其生成图像编码的潜力和限制,以及视觉先验的构建和使用,同时指出了任务和目标特定的研究方向。
- 自我提炼 StyleGAN: 以网络照片为基础的生成
本文提出了一种基于 StyleGAN 的自我蒸馏方法,通过生成图像的自我筛选和感知聚类来解决从互联网采集的未加工图像数据集中存在的离群值和多模态分布等挑战,实现高质量图像的生成。
- ECCV学习多个概率退化生成器实现无监督真实世界图像超分辨率
本研究提出一种概率降级生成器,用于训练无监督真实场景超分辨率模型,并通过使用多个生成器和协作学习来提高模型性能和稳健性,相关方法在基准数据集上表现出优异的性能。