May, 2020

探索基于时域卷积网络的 DNN 语音增强的最佳损失函数

TL;DR本文比较了基于短时傅里叶变换和时间域音频分离网络的两种不同的语音增强算法在不同数据集上的效果,提出了利用问题无关语音编码器特征的基于 STFT 的语音增强算法,通过在 Voice Bank+DEMAND 数据集上的实验验证,证明了该方法的有效性并在 DNS Challenge 数据集上表现出色,同时也开源了低延迟版本的 TasNet 算法。