Apr, 2023

思维链预测控制

TL;DR该论文研究了从示范中学习复杂低级控制任务的泛化策略学习,并提出一种新颖有效的方法,将时间抽象和具有规划能力的层次强化学习与模仿学习相结合,基于决策基础模型,利用可扩展的演示来学习具有一致性和结构化的长期行动指导,从而提高了低级操纵任务的性能。