Apr, 2024

MagicMirror: 基于受限搜索空间的快速高质量头像生成

TL;DR我们介绍了一个新颖的框架用于 3D 人体头像的生成和个性化,利用文本提示来提高用户参与度和定制性。通过克服面向照片真实感头像合成的挑战,我们的方法的核心创新在于应用条件神经辐射场(NeRF)模型,利用大规模多视角未注释数据集,创造出一个多功能的初始解空间,加速和多样化生成头像。此外,我们开发几何先验,利用文本到图像扩散模型的能力,确保视角不变性,并实现对头像几何的直接优化。这些基础思想结合我们基于变分分数蒸馏(VSD)的优化流程,有效减轻纹理损失和过饱和问题。通过广泛的实验验证,这些策略共同实现了具有无与伦比的视觉质量和更好的符合输入文本提示的定制头像的创建。您可以在我们的网站上找到更多的结果和视频。