ICLRNov, 2022
构建一个用于可扩展连续学习的策略子空间
Building a Subspace of Policies for Scalable Continual Learning
Jean-Baptiste Gaya, Thang Doan, Lucas Caccia, Laure Soulier, Ludovic Denoyer...
TL;DR本文介绍了一种基于 Continual Subspace of Policies 的自适应增量学习方法,使得机器人能够不断学习适应一系列任务,避免过多的模型大小或随着任务数量的增加导致性能下降的问题。实验表明该方法有效,没有出现遗忘现象,并且在 Brax(运动)和 Continual World(操作)两个领域的多个任务上表现较好。