Jun, 2024

SpikeLM: 基于弹性双脉冲机制的通用脉冲驱动语言建模

TL;DR向类似人脑的高能效人工智能迈进,生物启发的脉冲神经网络(SNN)具有生物合理性、事件驱动的稀疏性和二值激活的优势。本文提出了首个全脉冲机制,以处理包括鉴别性和生成性任务在内的一般性语言任务。与现有SNN中的二值脉冲不同,我们提出了一种具有双向、弹性幅度和弹性频率编码的更一般的脉冲形式,同时仍然保持了SNN的加法性质。在单个时间步内,脉冲通过方向和幅度信息增强;在脉冲频率方面,我们设计了一种控制脉冲发射率的策略。我们将这种弹性双脉冲机制应用于语言建模,命名为SpikeLM。这是首次使用全脉冲驱动模型处理一般性语言任务,其准确性远高于以前可能的水平。SpikeLM还极大地弥合了SNN和ANN在语言建模方面的性能差距。我们的代码可在此网址上获得:https://此URL。