ICMLApr, 2023

从像素中发现基于物体的广义值函数

TL;DR本文提出了一种基于对象的方法,试图从对象中发现有意义的特征,将其转化为具有时间相关性的 “指导” 函数,并利用随后学习到的一般价值函数进行控制,并且通过定性分析表明,学习到的表示不仅可解释而且围绕着任务之间不变的对象,从而促进了快速适应。