Mar, 2024

观点属于我,也属于你:使用共同基础理论对心智进行基准测试

TL;DR通过自然发生的口语对话构建首个基于一般认知论 (ToM) 的数据集 Common-ToM,研究表明语言模型在表现 ToM 时存在困难,但通过融合简单明确的信念表示可以提高语言模型在 Common-ToM 上的性能。