CVPRMay, 2019

Speech2Face:学习声音背后的面容

TL;DR本研究旨在利用数百万自然互联网 / YouTube 视频中的人物语音,建立和训练一个深度神经网络模型,以在不需要明确建模人物面部外貌特征的情况下,从个人短音频录音中重建面部图像,通过自我监督,研究模型如何识别人物的年龄、性别和种族。