Jan, 2020

利用时域 SpeakerBeam 改善目标语音提取的说话人识别能力

TL;DR本文提出 SpeakerBeam 算法实现对目标说话人的识别和提取,对同性别混合语音的语音分离效果不如期望,但在本文中提出的时间域、空间特征和辅助说话人识别方法使得提取效果得到增强并超过了 TasNet。