Oct, 2022

基于上下文的多任务分层逆强化学习算法

TL;DR提出了一种多任务分层对抗逆强化学习方法(MH-AIRL),用于训练具有分层结构的多任务策略,以提高复合任务的表现,增强对复杂、长周期任务的训练效率,降低数据需求以及提高对专家演示的利用效率。实验证明,与现有算法相比,MH-AIRL表现更优。