Aug, 2024

稀疏并行脉冲状态空间模型:学习长序列

TL;DR本研究解决了脉冲神经网络在长序列任务上的应用不足问题,提出了脉冲状态空间模型(SpikingSSMs),结合了状态空间模型的序列学习能力。研究结果表明,SpikingSSM在长范围基准任务中性能媲美先进的状态空间模型,同时实现了90%的网络稀疏性,并在语言建模任务中以较小的模型尺寸显著超越现有的脉冲大型语言模型,显示出其作为低计算成本LLM骨干架构的潜力。