Feb, 2024

Open RL基准:强化学习的全面跟踪实验

TL;DROpen RL Benchmark是第一个旨在提高和促进领域内研究人员工作的RL基准,它包含了一套完全跟踪的RL实验数据,以及算法特定和系统度量,成功复现了超过25000次运行的RL实验,涵盖了多个RL库和参考实现,并提供简单易用的命令行界面供使用。