Jun, 2024

BlockPruner:大型语言模型的细粒度剪枝

TL;DR我们提出了一种名为BlockPruner的新型无需训练的结构化修剪方法,通过定位多头注意力和多层感知机块中的冗余实现更精细的修剪,实验证明,与现有方法相比,BlockPruner在各种下游任务中实现了更精确和有效的修剪。