ICLRNov, 2022

构建一个用于可扩展连续学习的策略子空间

TL;DR本文介绍了一种基于 Continual Subspace of Policies 的自适应增量学习方法,使得机器人能够不断学习适应一系列任务,避免过多的模型大小或随着任务数量的增加导致性能下降的问题。实验表明该方法有效,没有出现遗忘现象,并且在 Brax(运动)和 Continual World(操作)两个领域的多个任务上表现较好。