Jun, 2024

音频曼巴:用于音频表示学习的双向状态空间模型

TL;DR通过引入纯SSM(state space models)模型的音频分类模型AuM,我们探讨了自注意力是否对音频分类任务至关重要,并在六个不同基准数据集上评估AuM的表现,结果表明它在性能上与已建立的AST模型相当或更好。