Feb, 2024

基于单张图像的实时三维感知肖像编辑

TL;DR该研究提出了 3DPE,一种能够根据给定提示(如参考图像或文字描述)以三维感知的方式高效编辑人脸图像的实用工具。通过从三维人像生成器和文本到图像模型中提取的一个轻量级模块,该系统提供面部几何知识和开放词汇编辑能力的先验知识。这种设计相比现有方法具有两个优势。首先,我们的系统使用前馈网络实现实时编辑(每图像约 0.04 秒),比第二位竞争者快 100 倍以上。其次,得益于强大的先验知识,我们的模块能够专注于学习与编辑相关的变化,在训练阶段同时处理各种类型的编辑,并在推断过程中快速适应用户指定的新型编辑(例如,每个案例约需要 5 分钟微调)。为了便于未来研究,代码、模型和界面将公开提供。