Nov, 2023

语言模型是否容易被语言幻觉欺骗?在句法方面较容易,在语义方面较困难

TL;DR语言模型的能力与人类在语法判断任务中的重叠度已被讨论,但当人类在语言处理中系统性地出现错误时,我们是否应该期望语言模型像语言认知模型一样模仿人类行为?通过研究与 “语言幻觉” 相关的语言模型更微妙的判断,本文回答了这个问题。研究发现,与需要复杂语义理解的比较幻觉和深度冲击幻觉相比,语言模型所代表的概率更可能与人类对结构依赖的 “负极性项目幻觉” 误判一致。没有一个单独的语言模型或度量方法能完全一致地与人类行为相符。最终,本文展示了语言模型在作为人类语言处理的认知模型以及识别复杂语言材料中微妙但关键信息的能力受到限制。