Feb, 2019

FurcaNeXt: 动态门控扩张时间卷积网络的端到端单声道语音分离

TL;DR本文提出了几种深度卷积网络,包括多尺度动态加权门控扩展金字塔网络(FurcaPy)、带有 Intra-Parallel 卷积组件的门控 TCN(FurcaPa)、共享权重的多尺度门控 TCN(FurcaSh)以及带有门控差异卷积分量的扩张 TCN(FurcaSu)并进行了直接最优化 utterance 级别的信号失真比(SDR)的训练。在公共 WSJ0-2mix 数据语料库上进行的实验表明,这些网络提高了 18.4dB 的 SDR,显示出对演讲者分离任务性能的改进。