Apr, 2020

D4RL:深度数据驱动强化学习数据集

TL;DR本研究为解决离线情境下强化学习(RL)的挑战,特意设计离线 RL 的基准测试任务,指导现实世界中数据集集合的设计与收集,并在开源代码上进行了综合评估,以便研究人员能够进一步完善现有算法及在这一新兴领域展开合作与探索。