Feb, 2024
使用条件扩散模型拼接子轨迹以实现目标条件离线强化学习
Stitching Sub-Trajectories with Conditional Diffusion Model for Goal-Conditioned Offline RL
Sungyoon Kim, Yunseon Choi, Daiki E. Matsunaga, Kee-Eung Kim
TL;DR使用 SSD 模型,基于离线数据集利用条件扩散模型生成高质量计划,成功将离线数据中的子优化轨迹段拼接起来,并在 GCRL 标准基准任务中取得了领先水平的性能。