Feb, 2024

BESA:使用块级参数高效稀疏分配对大型语言模型进行剪枝

TL;DR本论文提出了一种名为BESA的新颖大型语言模型修剪技术,通过施加分块重构损失来减少整体修剪误差并以可微分方式分配层特定的稀疏性,从而确保修剪后的模型性能降低程度减少,实验结果表明BESA在仅五小时内能够高效地修剪带有70B参数的LLMs,达到了最先进的性能水平。