Jul, 2023

学习动态属性分解世界模型以提高多目标强化学习效率

TL;DR在这篇论文中,我们介绍了动态属性因子强化学习(DAFT-RL)框架,通过利用物体中心表示学习从视觉输入中提取物体,并学习对它们进行分类和推断其潜在参数。我们通过学习类别的模板图和对象之间属性级别的相互作用模式图,以及描述对象之间相互作用的动态交互图,可以学习一个策略,从而可以在新的环境中直接应用通过估计交互和潜在参数。我们在三个基准数据集中评估了 DAFT-RL,并展示了我们的框架在跨不同属性和潜在参数的未知对象之间进行泛化以及复合之前学习的任务方面优于现有技术。