Oct, 2022

基于上下文的多任务分层逆强化学习算法

TL;DR提出了一种多任务分层对抗逆强化学习方法 (MH-AIRL), 用于训练具有分层结构的多任务策略,以提高复合任务的表现,增强对复杂、长周期任务的训练效率,降低数据需求以及提高对专家演示的利用效率。实验证明,与现有算法相比,MH-AIRL 表现更优。