May, 2023
扩散模型是多任务强化学习中有效的规划器和数据生成器
Diffusion Model is an Effective Planner and Data Synthesizer for Multi-Task Reinforcement Learning
Haoran He, Chenjia Bai, Kang Xu, Zhuoran Yang, Weinan Zhang...
TL;DR本文提出了一种基于 Transformers 和 prompt 学习的多任务扩散模型 MTDiff,利用扩散模型生成计划和数据合成,实现了跨不同多任务数据之间的隐式知识共享,并在 Meta-World 和 Maze2D 上的 50 个任务和 8 个地图中,达到了比现有算法更好的生成计划效果。