Aug, 2022

使用大型语言模型模拟多人并复制人类受试研究

TL;DR介绍了一种新的测试方法 —— 图灵实验(TE),用于评估语言模型(如 GPT-3)模拟人类行为的能力,设计实现了多项经济学、语言学和社会心理学实验的 TE,比较了不同语言模型再现经典实验的表现,揭示了一些语言模型的 “超级精度扭曲” 问题。