Oct, 2021

CARL:一种用于上下文和适应性强化学习的基准测试

TL;DRCARL 是一个基于理论框架的 RL 基准环境集合,包含了多个经典控制,物理模拟,游戏和实际应用领域任务,该研究证明了在考虑上下文时,从策略学习中分离状态的表征学习可以更好地实现泛化。