Mar, 2024

面部生成的可控语义潜在扩散模型

TL;DR基于新型潜在扩散模型结构的人脸生成和编辑的语义图像合成(SIS)框架,通过使用 SPADE 归一化和交叉注意力层合并形状和样式信息,允许对人脸的每个语义部分进行精确控制,从而实现对真实参考图像的重现、操纵和多样化生成的建议系统优于现有的最先进技术,经过广泛的实验验证了其在质量和数量上的优越性。