Oct, 2021

从视频和语言中学习可微分物理模型进行动态可视化推理

TL;DR本文提出了一种名为 VRDP 的统一框架,可以从视频和语言中联合学习视觉概念,并推断对象及其交互的物理模型,通过无缝集成三个组成部分:视觉理解模块、概念学习器和可微分的物理引擎。