Jan, 2025
利用结构状态空间模型的最先进语音识别:Samba-ASR
Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured
State-Space Models
TL;DR本研究解决了传统变压器模型在长序列处理和输入长度扩展中的局限性,通过提出Samba ASR模型,利用新颖的Mamba架构实现了语音识别的性能提升。实验结果显示,Samba ASR在多个标准基准测试中超越了现有的开源变压器模型,展现了其在低资源场景下的竞争力和计算效率,对语音识别领域的未来研究具有重要影响。