Sep, 2015

在线动态适应和神经网络先验的一次性操作技能学习

TL;DR本研究提出了一种基于模型的强化学习算法,将以前任务的先验知识与在线动态模型适应相结合,实现了高效学习,并且成功地应用于各种复杂机器人操纵任务。