Jan, 2024

修剪大型语言模型的快速和最优权重更新

TL;DR本文提出了一种基于交替方向乘法器的快速最优权重更新算法来修剪大型语言模型,配合简单的迭代修剪掩码选择,在广泛范围的大型语言模型中实现了最先进的剪枝性能。