Sep, 2023

基于深度学习的语音增强去噪过程连续建模

TL;DR本文研究了基于深度学习的语音增强中的连续建模方法,重点关注降噪过程。通过引入一个状态变量来表示降噪过程,训练中使用类似UNet结构的神经网络学习估计连续降噪过程中的每个状态变量,测试时引入一个控制因子作为嵌入,可调整噪声削减水平。该方法可以实现可控语音增强,并适用于不同的应用场景。实验结果显示,在清晰目标中保留少量噪声有助于语音增强,从客观语音指标和自动语音识别性能的改善来验证。