Feb, 2023
SpikeGPT:使用脉冲神经网络的预训练生成语言模型
SpikeGPT: Generative Pre-trained Language Model with Spiking Neural Networks
Rui-Jie Zhu, Qihang Zhao, Jason K. Eshraghian
TL;DR本文提出了基于 SNN 的生成语言模型 SpikeGPT,利用二进制、SNN 的事件驱动稀疏激活单元,将传统的注意力机制修改为逐步输入机制,并在多个数据集上验证了其性能与能耗,结果表明 SpikeGPT 在处理自然语言生成任务时表现出色并且能耗显著降低。