BriefGPT.xyz
Ask
alpha
关键词
spikformer
搜索结果 - 3
稀疏 Spikformer:脉冲变换器的令牌和权重剪枝的协同设计框架
SparseSpikformer 是一种通过令牌和权重修剪技术实现稀疏性的共设计框架,可以显著减少模型参数 90%并减少 20%的 GFLOPs,同时保持原始模型的准确性。
PDF
8 months ago
SpikeBERT: 从 BERT 进行两阶段知识蒸馏训练的语言 Spikformer
我们改进了最近提出的脉冲变压器(即 Spikformer)以使其能够处理语言任务,并提出了一种两阶段知识蒸馏方法来训练它,该方法结合了通过从 BERT 对大量无标签文本进行知识蒸馏的预训练和通过再次从 BERT 在相同训练样本上进行知识蒸馏
→
PDF
10 months ago
无注意力 Spikformer: 将脉冲序列与简单线性转换混合
通过将自注意力能力和脉冲神经网络(SNNs)的生物特性相结合,Spikformer 将蓬勃发展的 Transformer 架构应用于 SNN 设计。它引入了脉冲自注意力(SSA)模块,使用脉冲形式的查询、键和值来混合稀疏视觉特征,与之前的类
→
PDF
a year ago
Prev
Next