Mar, 2022
音视频语音编解码器:重新思考音视频语音增强通过再合成的方法
Audio-Visual Speech Codecs: Rethinking Audio-Visual Speech Enhancement by Re-Synthesis
Karren Yang, Dejan Markovic, Steven Krenn, Vasu Agrawal, Alexander Richard
TL;DR本文提出了一种新的音频 - 视觉语音增强框架,利用个人化模型和神经语音编解码器从嘈杂的信号中高效合成真实干净的语音,以提高增强幅度和视角方面的质量。