Jan, 2022

语义感知隐式神经音频驱动视频肖像生成

TL;DR该研究提出了一种语音驱动的 Semantic-aware Speaking Portrait NeRF (SSP-NeRF) 模型,该模型可以通过两个语义感知模块处理细节本地面部语义和全局头颈关系,从而通过一个统一的神经辐射场呈现面部表情,且通过进行大规模非刚性的 Torso 变形来稳定人物的大比例非刚性运动。