May, 2024

大型语言模型是否具有变色龙特性?

TL;DR大型语言模型(LLMs)是否具有其自己的世界观和个性倾向?对 LLM 模型回答主观问题的模拟进行了 100 多万次,将其回答与欧洲社会调查(ESS)的真实数据进行比较,结果表明问题引导对偏见和变异的影响是基本的,突出了主要的文化、年龄和性别偏见。文中还讨论了测量 LLMs 与调查数据差异的方法,如计算加权平均值和基于 Jaccard 相似性的一项新提出的测量。我们得出结论,在使用 LLMs 模拟个体决策或集体行为之前,分析问题引导的稳健性和变异性非常重要,因为它们的模拟能力充其量是近似的。