May, 2023
利用超定训练混合物的无监督神经语音分离
UNSSOR: Unsupervised Neural Speech Separation by Leveraging
Over-determined Training Mixtures
TL;DR在混响条件下,提出了一种使用深度神经网络进行无监督语音分离的算法,通过多个麦克风同时收集到的语音混合信号计算线性滤波器,使得所有说话者的估计信号在所有麦克风中加起来等于混合信号。此算法需要使用超定训练混合物,并通过降低源内幅度分散的损失来解决频率置换问题。实验结果表明,该算法在混响条件下对两个说话者的分离效果较好。