Nov, 2024

大型语言模型作为神经语言学主体:识别形式和意义的内部表现

TL;DR本研究解决了大型语言模型(LLMs)在符号(形式)和所指(意义)方面的语言理解差距。通过介绍一种新的神经语言学方法,结合最小对和诊断性探测,分析模型层的激活模式,我们发现LLMs在形式方面的能力优于意义,且意义的表现主要与形式相关。我们的研究为其在多语言环境中的表现提供了新的数据集,深化了对LLMs能力的理解。