ECCVJun, 2022

VisageSynTalk:通过语音面部特征选择,实现看不见的说话者的视频合成语音

TL;DR该论文介绍了一种从无声说话人面部视频中重建语音的方法,该方法通过分离视频中的语音内容和面部特征,并采用基于面部特征的语音合成器来综合这些分离的表示,实现了即使给定未知主题的视频也能生成包含正确内容的语音。