Apr, 2020

从推断到生成:端到端完全自监督的人脸语音生成

TL;DR本研究提出了一种多模态学习框架,利用近期发展的GAN技术,从声音波形中直接生成自然人脸图像分布,同时分析网络是否能够自然地分离生成人脸图像的两个潜在因素,并探索网络是否能够通过建模这些因素来生成自然的人脸图像分布。