BriefGPT.xyz
大模型
Ask
alpha
关键词
minerl basalt competition
搜索结果 - 4
BEDD: MineRL BASALT 评估与演示数据集,用于训练和评测解决模糊任务的智能体
该研究通过 MineRL BASALT 竞赛,提出了一种基于人类反馈学习的正式评估和演示数据集 (BEDD),用于算法的开发和性能评估。该数据集包含了从近 14,000 个 Minecraft 游戏视频中提取的 2,600 万个图像 - 动
→
PDF
7 months ago
通过人类反馈解决模糊任务:MineRL BASALT 2022 比赛回顾
通过在 Minecraft 中举办的 MineRL BASALT 比赛,我们旨在推动使用人类反馈来学习期望行为的算法的发展,以便在基础模型的微调方面进行研究。我们描述了比赛,并概述了前几名解决方案。最后我们讨论了比赛的影响和未来的改进方向。
PDF
a year ago
2021 年 BASALT 学习与人类反馈竞赛回顾
本文介绍了 MineRL BASALT 比赛,旨在鼓励研究使用来自人类反馈的学习技巧的代理解决开放世界任务,参赛团队的多样化反映出任务的设计有效性,但比赛参与者不足,作者对此进行了探讨和提出了改善建议。
PDF
2 years ago
从人类反馈中学习的 MineRL BASALT 比赛
MineRL BASALT competition focuses on the importance of learning from human feedback to build AI systems that would align
→
PDF
3 years ago
Prev
Next