Sep, 2022

接触丰富操作中的强化学习知识迁移

TL;DR本文介绍了一种基于多个技能先验的强化学习方法,通过学习每个任务所需技能的先验分布,并将任务的相似性与先前的任务进行比较,以指导在新任务上学习策略,从而更好地推广到训练中从未遇到的新任务。