BriefGPT.xyz
Ask
alpha
关键词
policy subspace
搜索结果 - 1
PaCo: 参数组合多任务强化学习
本文介绍了一种名为 PaCo 的参数组合方法,用于解决多任务强化学习中关于参数共享的挑战,并在 Meta-World 基准测试中取得了最先进的性能。
PDF
2 years ago
Prev
Next