Oct, 2018

VoiceFilter: 基于说话人条件的频谱掩码的定向语音分离

TL;DR本文提出一个新颖的系统用于从多人信号中分离目标说话者的声音,并通过两个神经网络来训练:说话人识别网络和谱掩蔽网络。该系统可明显降低多人信号上的语音识别错误率,并在单人信号上最小限度地降低错误率。