Feb, 2020

使用自适应和多头自注意力进行语音增强

TL;DR该论文研究了一种使用辅助说话者感知特征的自适应语音增强方法,从测试话语中直接提取用于适应的说话者表示。采用多任务学习的语音增强和说话人识别,并使用说话人识别分支的最终隐藏层输出作为辅助特征。此外,采用多头自注意力机制捕捉语音和噪声的长期依赖关系。在公共数据集上的实验结果表明,该策略实现了最先进的性能,并在主观质量方面优于传统方法。