Apr, 2022

具有视觉上下文注意力的唇语到语音合成生成对抗网络

TL;DR本文介绍了一种新型嘴唇到语音生成对抗网络 - 视觉上下文关注 GAN(VCA-GAN),它可以在语音合成期间同时建模本地和全局唇部动作,并通过同步学习指导生成器根据给定的输入唇部动作合成语音。