AAAIFeb, 2019

马拉松环境:基于现代视频游戏引擎的多智能体连续控制基准测试

TL;DR使用 Unity 游戏引擎和 Unity ML-Agents 工具包实现了一套开源环境,用于深度强化学习和连续控制的基准测试,通过证明这些基准测试的使用性,展示了这些环境的鲁棒性以及降低训练时间的策略。