分层决策Transformer

Sep, 2022

Hierarchical Decision Transformer

André Correia, Luís A. Alexandre

TL;DR本文提出了一种层次算法用于从演示中学习序列模型，可解决强化学习中的任务策略估计问题，通过选择子目标来指导低层控制器完成任务，改善了以往方法的性能，并证明了其在多项任务中优于基线方法，表明层次模型适用于从演示中学习序列模型。

Abstract

sequence models in reinforcement learning require task knowledge to estimate the task policy. This paper presents a →