CVPRApr, 2021

GATSBI:生成式面向智能体的时空对象交互

TL;DRGATSBI 是一种生成模型,可以将原始观测序列转换为结构化的潜在表示,充分捕捉智能体行动的时空上下文,使用无监督的物体中心场景表示学习来分离活动代理,静态背景和被动对象,建模反映分解实体之间因果关系的交互,并预测物理上合理的未来状态,优于其最先进的同行在场景分解和视频预测方面表现。