Nov, 2023

大型语言模型的心理测量预测能力

TL;DR语言模型的下一个词概率已成功模拟了人类阅读行为。然而,在此基础上的研究表明,为了提供人类首选回答而进行的指导调整反而降低了大型语言模型在计算心理语言学视角下的心理测量预测能力。此外,使用特定语言学假设的提示方法仍然不如基础语言模型,暗示最近的指导调整和提示方法在认知建模中无法提供比基础语言模型更好的估计。