Jun, 2024
LLM 是否具备类人推理能力?评估 LLM 对开放性回答的心智理论
Do LLMs Exhibit Human-Like Reasoning? Evaluating Theory of Mind in LLMs
for Open-Ended Responses
TL;DR利用 Reddit 的 ChangeMyView 平台的帖子,该研究评估了大型语言模型在处理心理理论推理时的能力,并通过提供人类意图和情感来增强模型表现,揭示了模型在开放式问题中与人类心理推理相比存在的差距。