Apr, 2024

特征修剪

TL;DR我们介绍了一种叫做 eigenpruning 的方法,它从 LLM 中移除特定任务中的奇异值,以提高其性能。这种方法受到解释性方法的启发,旨在自动找到解决特定任务的模型的子网络。在我们的测试中,经过修剪的模型在性能上远远优于原始模型,而仅需进行最少的计算来修剪权重矩阵。对于一个小的合成任务,即整数乘法,Phi-2 模型可以将测试集的准确率从 13.75%提高到 97.50%。有趣的是,这些结果似乎表明存在一种非常有效地解决任务的计算路径,但原始模型未使用。最后,我们计划在我们的工作的最终版本中开源我们的实现。