Mar, 2020

关于 2019 年 MineRL 竞赛在样本高效强化学习方面的回顾分析

TL;DR在 NeurIPS 2019 年会议上,我们举办了 MineRL Sample Efficient Reinforcement Learning Using Human Priors 比赛,旨在促进使用人类指导的强化学习算法的研究并减少解决复杂、分层、稀疏环境所需的样本数。本文概述了比赛的主要挑战、设计和提供给参与者的资源,并概述了使用深度强化学习和 / 或模仿学习的前几名解决方案以及我们的组织决策对比赛的影响和未来的改进方向。