AAAIJul, 2018

通过对抗性解缠音视频表示生成会说话的面部表情

TL;DR该研究旨在通过学习分解的音频 - 视觉表示来实现任意主题的对话面生成,并证明所学习的音频 - 视觉表示对于自动读唇和音频 - 视频检索任务非常有用。