Apr, 2022

2021 年 BASALT 学习与人类反馈竞赛回顾

TL;DR本文介绍了 MineRL BASALT 比赛,旨在鼓励研究使用来自人类反馈的学习技巧的代理解决开放世界任务,参赛团队的多样化反映出任务的设计有效性,但比赛参与者不足,作者对此进行了探讨和提出了改善建议。