ICMLFeb, 2021
AGENT:核心心理推理基准
AGENT: A Benchmark for Core Psychological Reasoning
Tianmin Shu, Abhishek Bhandwaldar, Chuang Gan, Kevin A. Smith, Shari Liu...
TL;DR通过使用过程生成的三维动画构建了一个基准测试,并通过人类评分验证了该基准测试,结果表明,要在人类水平上通过基础直觉心理学的设计测试,模型必须获得或具有代理计划的内置表示,该测试结构围绕四个场景,并比较了两个强大的基线建立在贝叶斯逆规划和心灵理论神经网络上。