- 基于扩散的人体姿态和形状编辑
人物图像中的姿势和身体形状编辑一直受到越来越多的关注。然而,当前的方法在处理大幅度编辑时往往受到数据集偏见的困扰,导致逼真度和人物身份的退化。我们提出了一种一次性方法,可以实现大幅度编辑并保留身份信息。为了实现大幅度编辑,我们使用一个 3D - PortraitBooth: 快速身份保留个性化的多用途肖像模型
PortraitBooth 是一种高效、鲁棒的个性化图像生成方法,使用人脸识别模型的主题嵌入来生成个性化图像,避免了费时的微调过程,保持了原始图像的身份,并通过情感感知的跨注意力控制实现了生成图像中多样的面部表情,支持基于文本的表情编辑。
- 基于扩散模型的并行视觉关注个性化人脸修复
本文提出了使用并行视觉注意力(Parallel Visual Attention,PVA)和扩散模型相结合的方法,实现面部修复过程中的身份保留,达到了无与伦比的身份相似性,并具备有效的语言可控性。与各种基准方法相比,PVA 在面部修复和具有 - 当 StyleGAN 遇上稳定扩散:个性化图像生成的 W_+ 适配器
利用扩展的 StyleGAN 嵌入空间和文本到图像扩散模型进行高保真度的身份保护和语义编辑,成功地生成个性化文本到图像输出。
- 增强身份保护对于扩散个性化的数据观点
使用大型文本到图像模型生成图像的能力已经引起了巨大的变革,但是对于特定独特或个人化的视觉概念,如您的宠物、屋内物品等,并不能被原始模型捕捉到。本文通过采用数据为中心的方法,提出了一种新颖的正则化数据集生成策略,旨在解决文本连贯性丧失和身份保 - CustomNet: 零样本目标定制与可变视角在文本至图像扩散模型中的应用
加入定制化物体到图像生成中,我们引入了 CustomNet,一个新的物体定制方法,通过显式地引入 3D 新视角合成能力来调整空间位置关系和视角,以有效地保留物体的身份信息,并通过文本描述或用户定义的图像实现位置和背景的灵活控制,从而实现了对 - FPGAN-Control: 用于训练合成数据的可控指纹生成器
使用合成数据训练指纹识别模型最近在生物特征学界引起了广泛关注,因为它减少了对敏感个人数据的依赖。我们提出了一种身份保留图像生成框架 FPGAN-Control,它能够控制生成指纹的图像外观,包括指纹类型、采集设备和压力水平等方面。我们实验证 - 多种面部属性的保持身份编辑:学习全局编辑方向和局部调整
通过使用 StyleGANs 的潜在空间和提出的方法进行面部图像编辑,我们介绍了一种名为 ID-Style 的新架构,可以解决在属性处理过程中面临的身份丢失问题。ID-Style 的关键组件包括可学习的全局方向(LGD),为每个属性找到共享 - MM多方面响应式听力头生成的 MFR-Net:通过去噪扩散模型
响应式听觉头部生成网络(MFR-Net)旨在通过生成侦听视频来模拟面对面通信情境,以姿态和观点表达对发言人作出响应,同时保持交互模式的多样性和侦听者身份信息的准确性。
- 通过可靠的监督提升通用人脸交换的可靠性
本研究提出一种可靠的 face swapping 框架,使用 cycle triplets 作为图像级别的指导,并通过 FixerNet 增强下半脸区域的表征,从而提高面部交换网络的性能和身份保留能力。
- CVPRDiffusionRig:学习个性化先验信息用于面部外观编辑
使用 DiffusionRig 和基于单张面部图片的 3D 面部模型,本文通过两阶段 - 先 - generic 后 - specific - 的方法来学习人脸先验,从而在保留身份信息的前提下,编辑人物的表情,头发光照等,展现出更好的 ph - 面部转换器:实现高保真度和准确率的人脸交换
本文描述了一种新颖的人脸交换网络,使用 transformer 网络来学习源脸部与目标脸部之间高质量的语义感知对应,实现在交换后的脸部图像中同时保留源身份和目标属性。
- FlowFace:基于语义流指导和形状感知的人脸交换
本文提出了一种基于语义流引导的两阶段框架 ——FlowFace 进行面部交换,FlowFace 可以成功传递源面部轮廓和内部面部特征到目标面部,从而获得更加逼真的面部交换效果。
- ECCV3D-FM GAN: 面部三维可控制变化
提出了一种新的 3D 可控脸部操作方法:3D-FM GAN,通过将输入脸部图像和 3D 编辑的真实渲染相结合,可以提供高质量、身份保留、3D 可控的脸部操作,相较于现有技术,具有更好的可编辑性、更强的身份保护和更高的照片逼真度。
- ICCV面部图像和视频的解缩聚变换器
本研究提出通过 StyleGAN 生成器的潜在空间编辑面部属性,通过训练专门的潜在空间转换网络并在损失函数中添加显式的分离和身份保存项来控制和保护身份,并介绍了一个将面部编辑推广到视频的流程。在真实图像和视频方面表现出出色的性能。
- 密集群众中的行人头部追踪
该研究提出一种基于头部检测和轨迹跟踪的算法来解决人群密度大的环境下的行人追踪问题,并提出了一种新的衡量算法效果的指标,并在 Crowd of Heads Dataset(CroHD)上进行了比较,表现优异。
- PIE: 针对语义控制的人像图像嵌入
本文提出了一种基于 StyleGAN 的新方法,将真实肖像图片嵌入潜空间,从而提供了对肖像图像头部姿态、面部表情和场景照明的直观编辑。通过 StyleRig,即一个预训练的神经网络,来实现参数空间中的语义编辑。我们设计了一种新的分层非线性优 - 边缘和身份保留网络用于人脸超分辨率
该论文提出了一种有效的人脸超分辨率恢复方法,称为 EIPNet,采用轻量级边缘块和身份信息来最小化变形。该方法还定义了身份损失函数来保留 SR 图像的身份信息,提供了 LCE 方法来分别推断 SR 图像中的亮度和颜色信息,并使网络能够在 R - MM使用图卷积网络的网格引导单次脸部再现
本文提出了一种使用重建的三维网格作为指导学习复合脸合成所需光流的方法,以便更精确地实现表情和姿势,在定性和定量比较方面优于现有方法,并解决现有方法在单次或少次情况下的身份保护问题。
- CVPRVec2Face: 从 Face Recognition 的黑盒特征中揭示人脸
本文提出了一种新的生成模型 - 双射生成对抗网络,并引入成分提取和度量学习来增强图像的重建过程,最终生成出具有真实性和身份保留特性的面部图像。该模型在多个基准数据集上进行实验,证明了其有效性。