Oct, 2023

SlotGNN:无监督发现多物体表示和视觉动态

TL;DR利用无监督技术从视觉数据中学习多对象动态是一项具有挑战性的任务。本文提出一种新的框架,通过机器人交互学习可以学到稳健的对象表示的两个新架构:SlotTransport 用于从 RGB 图像中发现对象表示,SlotGNN 用于从 RGB 图像和机器人交互中预测它们的集体动态。