AAAINov, 2022

SyncTalkFace:通过音 - 唇记忆实现精准嘴唇同步的说话人脸生成

TL;DR该论文提出了一个名为 Audio-Lip Memory 的技术,使用存储在音频特征中的唇部运动信息来帮助生成与音频最匹配的嘴形,从而使得面部运动与音频之间出现了更加精细的时序一致性,实现了更高质量的谈话面部生成。