MMDec, 2019

使用控制延迟的 BLSTM 进行单通道多说话人语音分离的语音级置换不变训练

TL;DR本文提出使用延迟控制的 BLSTM (LC-BLSTM) 以在推理期间完成低延迟和良好性能的语音分离,并发现在使用 LC-BLSTM 期间,uPIT 优于 cPIT,进一步通过跨块说话者跟踪(ST)可以提高 uPIT-LC-BLSTM 的分离性能,并且在 WSJ0 两个人混音语音分离任务中评估,uPIT-BLSTM 和 uPIT-LC-BLSTM 之间的信号失真比(SDR)的绝对差距缩小到 0.7dB 以内。