ICMLJun, 2024

EvIL:演化策略用于可广泛应用的模仿学习

TL;DR在仿真学习中,我们通过整合奖励模型集合以及使用演化策略方法 EvIL 来提高重新训练和迁移性能,同时加速目标环境中的重新训练,在连续控制任务中比之前的工作更加高效地重新训练策略。