Feb, 2024

大型语言模型是否反映认知语言处理?

TL;DR大型语言模型(LLM)在文本理解和逻辑推理方面表现出了非凡的能力,在多个认知任务中实现或甚至超过了人类水平的表现。本文提出了一种新的方法,通过将LLM表示与人类认知信号进行桥接,评估LLM在模拟认知语言处理方面的有效性。我们采用了表示相似性分析(RSA)来衡量16个主流LLM与脑部fMRI信号之间的对齐程度。实证研究调查了多种因素(如模型扩展、对齐训练、指令附加)对LLM-脑信号对齐的影响。实验结果表明,模型扩展与LLM-脑信号相似性呈正相关,对齐训练可以显著提高LLM-脑信号相似性。此外,广泛的LLM评估(如MMLU,Chatbot Arena)的性能与LLM-脑信号相似性高度相关。