ICMLJun, 2022

用于任务无关状态抽象的因果动态学习

TL;DR本文介绍了一种名为 CDL 的任务无关状态抽象的因果关系动力学学习模型,它不仅从学习的动力学中产生状态抽象,而且还通过消除状态变量和动作之间的不必要依赖来提高泛化能力,并在两个模拟环境和下游任务中表现出比现有状态抽象方法更好的样本效率和对未知状态更好的泛化性能。