May, 2024

深度强化学习中具有任务关联的近端课程

TL;DR基于近发展区概念,我们提出了一种名为ProCuRL-Target的新型课程计划,它可以在复杂任务的目标分布上平衡选择任务的需要,通过利用任务之间的相关性推动代理的学习,从而加速深度强化学习代理的训练过程。