Feb, 2024

BESA:使用块级参数高效稀疏分配对大型语言模型进行剪枝

TL;DR本论文提出了一种名为 BESA 的新颖大型语言模型修剪技术,通过施加分块重构损失来减少整体修剪误差并以可微分方式分配层特定的稀疏性,从而确保修剪后的模型性能降低程度减少,实验结果表明 BESA 在仅五小时内能够高效地修剪带有 70B 参数的 LLMs,达到了最先进的性能水平。