BriefGPT.xyz
大模型
Ask
alpha
关键词
smarties test
搜索结果 - 1
ToMChallenges:探索心理理论的原则导向数据集和多元评估任务
本研究通过创建 ToMChallenges 数据集以综合评估 Sally-Anne 和 Smarties 测试来测试大型语言模型对理解他人的心理状态的能力,包括现实性、信念、一阶信念和二阶信念,并通过创建适用于每个任务类别的独特提示来为不同
→
PDF
a year ago
Prev
Next