Oct, 2022

PaCo: 参数组合多任务强化学习

TL;DR本文介绍了一种名为 PaCo 的参数组合方法,用于解决多任务强化学习中关于参数共享的挑战,并在 Meta-World 基准测试中取得了最先进的性能。