Aug, 2023

使用 BGRU 和 GMM 改进深度吸引网络用于语音分离

TL;DR提出了一种使用双向门控神经网络(BGRU)来简化和增强深度吸引子网络(DANet)模型的方法,使用高斯混合模型(GMM)作为聚类算法,以降低复杂度并提高学习速度和准确性。对 TIMIT 语料库中的混合语音数据集进行了实验评估,该模型在 SDR 和 PESQ 分数上分别达到 12.3 dB 和 2.94,表现优于原始 DANet 模型。