Jan, 2017

Vid2speech:从无声视频中重建语音

TL;DR该研究利用卷积神经网络提出了一种端到端的模型,可以从无声视频帧生成可听的语音信号,实现了较高的单词清晰度,并展示了学习未识别单词的良好效果。