Jan, 2023

自监督多任务预训练:控制变压器

TL;DR本文提出一种通用的预训练 - 微调流水线 ——Self-supervised Multi-task pretrAining with contRol Transformer(SMART),通过设计一种控制中心的自监督微调目标,结合控制变压器(CT)实现了对短期控制和长期控制相关的信息的捕捉,在 DeepMind 控制套件上的广泛实验表明 SMART 极大地提高了在不同的学习场景下(包括模仿学习和强化学习)的学习效率和泛化能力。