Oct, 2023

寻找神经策源地:从参数角度看大型语言模型的知识转移

TL;DR通过参数的视角,本文以敏感性为基础的技术来提取和对齐不同规模的大型语言模型之间的知识特定参数,并且使用 LoRA 模块作为注入提取的知识到较小模型的中间机制,通过四个基准测试验证了我们提出的方法的有效性,突出强调了影响参数化知识传递过程的重要因素,凸显了模型参数在不同规模的大型语言模型之间的可转移性。