面孔扩散以实现快速和可编辑的面部个性化
该论文提出了一种优化自由的面部识别编码器,以在条件面部图像中保留面部标识符,并提出了自我增强的可编辑性学习方法,从而在更快的速度下生成具有不同场景下的保留标识符的图像。
Jul, 2023
DiffusionFace 是第一个基于扩散的面部伪造数据集,包括各种伪造类别,包括无条件和文本引导面部图像生成,Img2Img,修复和基于扩散的面部交换算法。数据集具有广泛的 11 个扩散模型和生成图像的高质量,为评估提供必要的元数据和来自现实世界的网络源伪造面部图像的数据集。此外,我们对数据进行深入分析,并引入实际评估协议以严格评估鉴别模型在检测假冒面部图像方面的有效性,旨在增强面部图像验证过程中的安全性。数据集可从 https://github.com/Rapisurazurite/DiffFace 下载。
Mar, 2024
本文通过面部区域适应和语义保真令牌优化的两个角度,将准确和语义保真的 ID 嵌入到稳定扩散模型中,以实现个性化生成,并通过实验证明与以前的方法相比,我们的结果在 ID 准确性和操作能力方面表现出更卓越的能力。
Jan, 2024
本文提出了一种名为 FADING 的基于扩散编辑的面部老化方法,通过利用大规模语言 - 图像扩散模型的丰富先验信息,通过特定的预训练扩散模型和年龄感知微调策略,将输入图像逆向编码到潜在噪声并获得优化的空文本嵌入,最后通过注意力控制进行基于文本的局部年龄编辑,定量和定性分析表明,该方法在老化准确性、属性保护和老化质量方面优于现有方法。
Sep, 2023
该研究提出了一种基于条件潜在扩散模型的新方法 (IDiff-Face),用于合成身份生成,以实现面部识别训练中的逼真身份变化,通过广泛评估,该合成基础的面部识别方法在 Labeled Faces in the Wild (LFW) 基准测试上实现了 98.00% 的准确率,远超最近的合成基础面部识别解决方案的 95.40%,并填补了与基于真实数据的面部识别准确率为 99.82% 之间的差距。
Aug, 2023
IDAdapter 是一种无需微调的方法,通过在生成过程中结合文本和视觉注入以及面部身份损失,从单个人脸图像中增强个性化图像生成的多样性和身份保留。通过将特定身份的多个参考图像的混合特征融入训练阶段,丰富相关身份的内容细节,指导模型生成具有比以往作品更多样的风格、表情和角度的图像。广泛的评估显示了我们方法的有效性,在生成的图像中实现了多样性和身份保真度。
Mar, 2024
人物图像中的姿势和身体形状编辑一直受到越来越多的关注。然而,当前的方法在处理大幅度编辑时往往受到数据集偏见的困扰,导致逼真度和人物身份的退化。我们提出了一种一次性方法,可以实现大幅度编辑并保留身份信息。为了实现大幅度编辑,我们使用一个 3D 人体模型进行拟合,将输入图像投影到 3D 模型上,并改变人体的姿态和形状。由于初始纹理身体模型存在由于遮挡和不准确的身体形状引起的伪影,渲染图像经历了一种基于扩散的细化过程,在这个过程中,强噪声破坏了身体结构和身份,而不充分的噪声并没有起到帮助作用。因此,我们提出了一种迭代细化方法,首先对整个身体进行弱噪声处理,然后对脸部进行细化。通过自监督学习进一步增强了真实感,通过微调文本嵌入。我们的定量和定性评估表明,我们的方法在各种数据集上优于其他现有方法。
Jan, 2024
论文探讨了使用编码器和扩散生成器来进行个性化图像生成的方法,并比较了该方法与 Fine-tuning 等已有方法的性能,实验结果表明,该方法在图像生成和重建上表现更好,且适用于更多应用场景。
Apr, 2023
通过引入 DiFF 数据集,本文首次探索了面向脸部的扩散生成图像的领域,分析结果揭示了识别扩散生成的假脸面临的挑战,并提出了一种边缘图正则化方法来增强现有检测器的泛化能力。
Jan, 2024
通过引入高效有效的 Face-Adapter,我们旨在解决资源密集型的训练问题,从而实现预训练扩散模型的高精度和高保真度的人脸编辑,该模型在运动控制精度、ID 保留能力和生成质量方面具有可比甚至优越的表现。
May, 2024