May, 2023

MetaDiffuser:离线Meta-RL的扩散模型作为条件规划器

TL;DR本文提出了一种基于任务的条件扩散规划器(MetaDiffuser)来解决离线 meta-RL 中通用性问题,该规划器可以生成针对任务的轨迹以在各种任务间进行规划。实验结果表明 MetaDiffuser 能够表现出优异的生成轨迹能力,优于其他离线 meta-RL 基线模型。