Oct, 2023

人类与语言模型在预测重复文本时的差异

TL;DR通过研究语言模型在下一个单词预测任务中的表现与人类行为模式的比较,发现人类与 GPT-2 语言模型在文本展现初期表现强相关,随着记忆(或背景学习)的作用逐渐发挥,二者的表现迅速分歧,研究发现这种分歧的原因是特定的中间层注意力头部,为此通过在这些注意力头部中添加幂律最近偏倚,构建了一个更接近人类行为的模型,希望此案例能够推动将语言模型更加贴近人类行为的未来研究。