Jul, 2018

单通道语音混合中基于深度提取网络的目标说话人恢复

TL;DR该研究提出了一种新的基于深度提取器网络的说话人感知源分离方法,它能够在高维空间构建提取器点以提取目标说话人的信息。实验结果表明该方法可以高效地从混合音频中恢复高质量的目标语音,相比基线深度吸引子模型,SDR 和 PESQ 都有 5.2% 和 6.6% 的相对改进,并且该方法可以很好地推广到多个干扰说话人的情况下。