Mar, 2022

ScienceWorld:您的智能代理比五年级的学生更聪明吗?

TL;DR我们介绍了ScienceWorld,这是一个新的交互式文本环境下测试代理进行科学推理能力的基准,并发现交互式环境对于代理实现理解科学问题和推理能力非常重要。实验表明交互模式下1.5百万参数的模型能够优于静态模型中训练了上百万个示例的11亿参数模型。