Jun, 2023

增强神经波束形成器结合空间信息用于目标语音提取

TL;DR本文提出了一种利用空间信息增强神经波束形成器性能的目标语音提取网络,该网络采用 UNet-TCN 结构模拟输入特征,并通过引入多头交叉注意力机制来利用阵列接收到的空间信息,实现了更合理的目标掩蔽估计网络和基于空间信息的交叉注意力机制,有效提高语音分离性能。