Apr, 2024

SPMamba:语音分离中你所需的全部是状态空间模型

TL;DR本文以状态空间模型为基础,提出了一种用于语音分离的网络架构,即 SPMamba。通过将 TF-GridNet 模型的 Transformer 组件替换为双向 Mamba 模块,旨在捕捉更广泛的上下文信息。实验结果表明,基于 Mamba 的模型在性能方面发挥了重要作用,SPMamba 在建立在 Librispeech 数据集上的模型中表现出优越的性能,与 TF-GridNet 相比,在 SI-SNRi 方面提高了 2.42 dB。SPMamba 的源代码可在此 https URL 提交。