Jul, 2024

心理测量对齐:通过语言模型捕捉人类知识分布

TL;DR本研究着眼于语言模型(LMs)在模拟人类响应中的局限性,尤其是其与人类知识分布对齐的不足。提出了一种新的“心理测量对齐”指标,通过分析人类与LMs在同一测试项目上的响应,揭示了现有LMs在多个现实领域内的显著误差。此外,研究表明,基于人格的提示和训练LMs使用目标分布的人类响应数据能够改善这种对齐程度。