Oct, 2022

物体类别感知强化学习

TL;DR本篇论文提出了一种新的框架——OCARL,通过利用对象的类别信息来促进感知和推理,包括三部分:具有类别感知能力的无监督对象发现,具有对象类别感知能力的感知以及采用多个独立的对象 - 类别特定网络进行推理的对象中心模块化推理。实验表明,在对象导向的强化学习领域,OCARL可以提高样本效率和泛化能力。