Feb, 2024

使用条件扩散模型拼接子轨迹以实现目标条件离线强化学习

TL;DR使用SSD模型,基于离线数据集利用条件扩散模型生成高质量计划,成功将离线数据中的子优化轨迹段拼接起来,并在GCRL标准基准任务中取得了领先水平的性能。