CVPRMay, 2024

增强式说话人脸视频生成与评估的音频视觉语音表示专家

TL;DR使用 AV-HuBERT 进行口型同步损失的计算,并引入三种新的口型同步评估指标,以提供全面的口型同步性能评估。实验结果和详细的消融研究表明了我们方法的有效性和提出的评估指标的实用性。