Nov, 2022

残差技能策略:学习适应性技能基础的动作空间,用于机器人增强学习

TL;DR通过使用状态条件生成模型在技能空间中加速探索,同时提出低层次的剩余策略来适应未知的任务变化,从而在与先前工作的比较中显着加快了探索速度,并跨四个不同于那些用于构建技能空间的具有挑战性的操作任务进行了验证。