May, 2022

学习用于规划的抽象且可迁移的表示

TL;DR该论文提出了一个框架来自我学习代理环境的状态抽象,这些抽象是任务无关的可重用的,从而显著提高了学习效率和代理任务解决的能力。