Sep, 2024

JEAN:基于音频引导的联合表情与 NeRF 的谈话面孔生成

TL;DR本研究解决了现有方法在生成谈话面孔时难以同时保持说话者身份和真实面部表情的问题。提出了一种基于 NeRF 的网络,通过自监督学习提取音频特征,并采用对比学习方法,确保音频特征与口部运动的对齐,同时拆分与面部其他肌肉运动无关的部分。研究结果表明,该方法能够合成高保真度的谈话面孔视频,并在面部表情转移和口型同步方面达到最新的技术水平。