AAAIDec, 2023

高斯任务上下文与技能的元强化学习解耦

TL;DR离线元强化学习方法(即通过先前经验适应未见的目标任务)在机器人控制任务中至关重要。本文提出了一种名为分离式元强化学习(DCMRL)的框架,通过对任务上下文和技能的学习和探索进行量化和离散化,从而获取可推广的先前经验并在元测试阶段实现对未见目标任务的有效适应。实验证明,DCMRL 比先前的元强化学习方法具有更具推广性的先前经验,并在导航和机器人操纵连续控制任务中更加有效。