Jun, 2023

关于大型语言模型调查回答的质疑

TL;DR通过评估 13 种不同大小的语言模型在美国人口普查局的《美国社区调查》问题上的回答,我们发现较小的模型存在显着的位置和标记偏差,较大的模型则偏差较小。另外发现不管如何提示模型,都趋向于随机统计所有调查答案的数据,因此,这表明大型语言模型调查回答的统计数据缺乏与人类群体中的信号相关联的特征。