Mar, 2024

通过直接的跨模态映射和几何规则化进行快速的文本到 3D 感知人脸生成和操纵

TL;DR提出了一种高效并且准确的网络,用于快速生成和处理 3D 感知人脸,名为 $E^3$-FaceNet,通过直接映射文本指令到 3D 感知的视觉空间,实现类似图片的 3D 人脸生成和处理,并显著提高推断速度。