AAAIDec, 2020

交互式语音和噪声模型用于语音增强

TL;DR该论文提出一种名为 SN-Net 的基于卷积神经网络的方法,通过引入多个交互模块,在中间的特征通道处同时建立对语音和噪声的模型。同时,利用残差卷积和注意力模块来捕获时间和频率特征,提高模型识别能力,在多项评估指标上优于现有最新技术,并对说话者分离具有卓越的性能表现。