BriefGPT.xyz
Mar, 2022
ScienceWorld:您的智能代理比五年级的学生更聪明吗?
ScienceWorld: Is your Agent Smarter than a 5th Grader?
HTML
PDF
Ruoyao Wang, Peter Jansen, Marc-Alexandre Côté, Prithviraj Ammanabrolu
TL;DR
我们介绍了ScienceWorld,这是一个新的交互式文本环境下测试代理进行科学推理能力的基准,并发现交互式环境对于代理实现理解科学问题和推理能力非常重要。实验表明交互模式下1.5百万参数的模型能够优于静态模型中训练了上百万个示例的11亿参数模型。
Abstract
This paper presents a new
benchmark
,
scienceworld
, to test agents'
scientific reasoning
abilities in a new interactive text environment at
→