AAAINov, 2019

PHASEN:一个考虑相位和谐波的语音增强网络

TL;DR本文介绍了一种基于深度神经网络的相位和谐感知模型(PHASEN),用于单通道语音增强,其中使用两种不同的流进行幅度和相位预测,并设计了频率转换模块来捕捉沿频率轴的长程相关性,在 AVSpeech + AudioSet 和 Voice Bank + DEMAND 数据集上分别获得 1.76dB 和大幅优于以前方法的表现。