Sep, 2024

通过心理测量工具评估和操控预训练语言模型中的潜在构念

TL;DR本研究解决了目前缺乏评估大规模语言模型心理构念的方法这一问题。通过将标准心理问卷重新构建为自然语言推理提示,并提供代码库,研究展示了多个语言模型中存在与人类心理相关的构念,如焦虑和抑郁,并与人类心理学理论一致。该方法增强了语言模型的可解释性和可信度,推动了更可控的模型发展。