Feb, 2021

基于上下文表示的多任务强化学习

TL;DR提出一种多任务学习的方法,通过元数据构建可组合且可解释的表示,从而改进多任务学习性能,并在一个包含50个不同机器人操作任务的具有挑战性的多任务基准Meta-World上实现了最先进的结果。