Sep, 2023

FaceDiffuser: 基于扩散的语音驱动 3D 面部动画合成

TL;DR用 FaceDiffuser 生成非确定性的深度学习模型,基于扩散技术和 HuBERT 预训练模型对音频输入进行编码,用于生成语音驱动的三维面部动画合成。