May, 2024

音频曼巴:用于音频标记的预训练音频状态空间模型

TL;DR通过提出自注意力自由的方法,音频马巴(Audio Mamba)利用状态空间模型来捕捉长音频频谱的依赖关系,实现了参数的高效性,并且在两个音频标记数据集上取得了与状态机最新技术相媲美的结果。