Oct, 2023

揭示大型语言模型中的核心语言区域

TL;DR通过进行类比研究,本文发现大型语言模型中存在一个与语言能力对应的核心区域,占据总模型参数的约 1%。该核心区域表现出显著的维度依赖性,对特定维度上的单个参数的扰动可能导致语言能力的丧失。此外,我们观察到语言能力的提高并不一定伴随模型知识水平的提升,这可能暗示着与语言区分离的领域知识区域存在。总的来说,探索大型语言模型的功能区域为我们提供了有关其智能基础的见解。未来,我们将继续研究语言模型内部的知识区域及其之间的互动。