BriefGPT.xyz
Sep, 2022
分层决策Transformer
Hierarchical Decision Transformer
HTML
PDF
André Correia, Luís A. Alexandre
TL;DR
本文提出了一种层次算法用于从演示中学习序列模型,可解决强化学习中的任务策略估计问题,通过选择子目标来指导低层控制器完成任务,改善了以往方法的性能,并证明了其在多项任务中优于基线方法,表明层次模型适用于从演示中学习序列模型。
Abstract
sequence models
in
reinforcement learning
require task knowledge to estimate the
task policy
. This paper presents a
→