Oct, 2021
从视频和语言中学习可微分物理模型进行动态可视化推理
Dynamic Visual Reasoning by Learning Differentiable Physics Models from Video and Language
Mingyu Ding, Zhenfang Chen, Tao Du, Ping Luo, Joshua B. Tenenbaum...
TL;DR本文提出了一种名为 VRDP 的统一框架,可以从视频和语言中联合学习视觉概念,并推断对象及其交互的物理模型,通过无缝集成三个组成部分:视觉理解模块、概念学习器和可微分的物理引擎。