ICMLJun, 2024

位置:强化学习研究中的基准测试受限

TL;DR通过对 rigorous experiment designs 的计算成本的探究,本研究提倡使用额外的实验范式来克服 benchmarking 的局限性。