该论文提出了一种优化自由的面部识别编码器,以在条件面部图像中保留面部标识符,并提出了自我增强的可编辑性学习方法,从而在更快的速度下生成具有不同场景下的保留标识符的图像。
Jul, 2023
我们介绍了基于 InstantID 的个性化图像合成方法,通过应用 IdentityNet 模型,使用单张面部图像实现各种风格的图像个性化,同时确保高保真度,并与 SD1.5 和 SDXL 等常用预训练文本到图像扩散模型无缝集成,具有卓越的性能和高效性,在重视身份保护的实际应用中极具益处。
Jan, 2024
在这项工作中,我们提出了 StableIdentity,它允许只通过一张面部图像实现一致性身份重构,并且可以在各种情境中灵活注入所学到的身份,从而实现前所未有的图像、视频和 3D 定制生成模型。
本文提出了一个基于 ID 保持的讲话头生成框架,改进了以往的方法,使用密集地标点实现精确的几何感知流场与自适应融合源身份,使用元学习方法实现快速个性化模型的快速适应,并且增加时空增强模块以提高细节和时序性,实验表明本文的方法在单次和个性化设置中均显著优于现有技术。
Dec, 2022
通过使用一个交叉注意力机制来合并身份、风格和语义特征生成尽可能与输入相似的人脸的 SIS 架构,不仅适用于保护身份,而且在面部识别对抗攻击中也是有效的。
Apr, 2024
PortraitBooth 是一种高效、鲁棒的个性化图像生成方法,使用人脸识别模型的主题嵌入来生成个性化图像,避免了费时的微调过程,保持了原始图像的身份,并通过情感感知的跨注意力控制实现了生成图像中多样的面部表情,支持基于文本的表情编辑。
Dec, 2023
FaceChain 是一个个性化肖像生成框架,结合一系列定制图像生成模型和丰富的与人脸相关的感知理解模型,通过只有少量肖像图像作为输入,解决了现有解决方案中产生真实细节的漏洞和包含扭曲、模糊或损坏区域的合成人脸问题。
Aug, 2023
FlashFace 是一种实用工具,用户可以通过提供一张或几张参考人脸图片和一个文本提示,轻松地即时个性化自己的照片。该方法通过两个微妙的设计与现有的人脸个性化方法有所区别,具有更高保真度的身份保存和更好的指令跟随。实验证明了我们的方法在各种应用中的有效性,包括人体图像个性化、根据语言提示进行人脸替换、将虚拟角色变成真实人物等。
Mar, 2024
DreamSalon 是一个噪声引导的阶段编辑框架,专注于详细的图像操作和身份环境保持,通过识别预测噪声的频率和梯度来确定编辑和增强阶段,并通过混合源和目标文本提示来指导模型对特定编辑区域进行精确操作,在人脸编辑领域高效而忠实地编辑细节,并在定性和定量上优于现有方法。
本文介绍了一个新颖的多模式人脸生成框架,能够同时进行身份 - 表情控制和更细粒度的表情合成,并通过创新设计在条件扩散模型中实现身份和表情的分别控制。实验证明了该框架在可控性和可扩展性上的优越性。