Feb, 2024

使用条件扩散模型拼接子轨迹以实现目标条件离线强化学习

TL;DR使用 SSD 模型,基于离线数据集利用条件扩散模型生成高质量计划,成功将离线数据中的子优化轨迹段拼接起来,并在 GCRL 标准基准任务中取得了领先水平的性能。