May, 2023

GeneFace++: 实时稳定的通用音频驱动 3D 口型生成

TL;DRGeneFace++ 是目前第一个实现了稳定和实时的通用音频 - 唇形同步对话人肖像生成,并通过采用辅助特征、引入时间损失、设计计算效率高的 NeRF 模型等方法处理了唇形同步、视频质量和系统效率等方面的挑战。