Dec, 2023

BEDD: MineRL BASALT 评估与演示数据集,用于训练和评测解决模糊任务的智能体

TL;DR该研究通过 MineRL BASALT 竞赛,提出了一种基于人类反馈学习的正式评估和演示数据集 (BEDD),用于算法的开发和性能评估。该数据集包含了从近 14,000 个 Minecraft 游戏视频中提取的 2,600 万个图像 - 动作对和 3000 多个密集的人类评估,为新算法的评价提供了一个固定的、初步的排行榜。此外,研究还对这些数据进行了详细分析,以指导算法的开发和评估。