May, 2020

基于注意力神经网络的目标说话人分离

TL;DR本文提出了一种基于注意力机制的神经网络(Atss-Net)来进行基于深度学习的目标说话人分离和语音增强,实验结果表明 Atss-Net 在频谱图领域比 CNN-LSTM 架构更有效,并且在语音增强方面也具有良好的性能。