Apr, 2024

决策变压器作为部分可观测连续控制的基础模型

TL;DR利用预训练的语言模型,探索决策变压器(DT)架构作为一种通用的控制器综合框架,同时展示了 DT 在各种控制任务上的能力,包括对非线性动力系统和部分微分方程进行控制,并具备出色的零样本泛化能力。