Sep, 2023

诊断和利用视频游戏的计算需求进行深度强化学习

TL;DR通过提出学习挑战诊断器 (LCD) 并使用其在 Procgen 基准测试中发现新的挑战分类,研究报道了在优化深度强化学习算法时出现的多种失败情况,并为更高效的进展提供了一条路径。