Apr, 2024

SNP:结构化神经元级剪枝以保持注意力分数

TL;DR我们提出了一种新颖的图感知神经元级剪枝方法(SNP),通过剪枝数据图中信息较少的注意力分数和消除多头冗余,有效压缩和加速基于 Transformer 的模型,适用于边缘设备和服务器处理器。