Jun, 2023

IQL-TD-MPC:基于隐式 Q - 学习的分层模型预测控制

TL;DR本文提出了一种基于模型的强化学习算法 IQL-TD-MPC,并通过此算法构建一个层级架构,使用规划生成的意图嵌入来增强任何现成的离线强化学习算法,从而显着提高在 D4RL 基准任务中的性能。