Apr, 2022

机器人基于离线数据的终身学习中的遗忘和不平衡问题

TL;DR本文介绍了在生命周期内,机器人应该如何快速适应不断变化的环境,在强化学习领域下提出了离线蒸馏管道算法,解决了传统算法在新旧环境中表现的困境以及在多种环境中训练数据失衡等问题,并通过模拟仿生机器人步行任务的实验进行了检验。