May, 2023

一种基于神经状态空间模型的高效语音分离方法

TL;DR提出了一种基于神经状态空间模型的高效音频分离框架 S4M,该模型可以将输入信号建模为线性常微分方程的形式,并在多尺度表示学习中学习全局一致的分离和重构,其模型复杂度显著低于 Attention-based Sepformer。