May, 2023

扩散模型是多任务强化学习中有效的规划器和数据生成器

TL;DR本文提出了一种基于 Transformers 和 prompt 学习的多任务扩散模型 MTDiff,利用扩散模型生成计划和数据合成,实现了跨不同多任务数据之间的隐式知识共享,并在 Meta-World 和 Maze2D 上的 50 个任务和 8 个地图中,达到了比现有算法更好的生成计划效果。