Sep, 2023

研究自评测验在大型语言模型的人格测量中的适用性

TL;DR大规模语言模型的人格测量结果依赖于自我评估测试的选择,而人类使用的测试无法准确衡量LLM的人格特点。