Nov, 2022

SkillS: 自适应技能序列用于高效的时间扩展探索

TL;DR我们提出了一种在多个领域中比现有方法更出色的技能转移方法,通过学习现有的时间扩展技能序列来进行探索,并直接从原始经验中学习最终策略,实现快速适应和高效数据收集。