Mar, 2021
通过动态视觉推理理解对象和事件的物理概念
Grounding Physical Concepts of Objects and Events Through Dynamic Visual
Reasoning
TL;DR本文提出了一种统一框架-动态概念学习者(DCL)用于从视频及自然语言文本中,对物理对象和事件进行建模,其中DCL采用轨迹提取器来追踪每个物体随时间的变化并将其表示为一种潜在目标中心的特征向量,并进一步将物体集成到图形网络中学习物体之间的动态交互关系,最终通过语义分析器解析问题并执行执行器来回答问题,该方法在CLEVRER数据集上实现了state-of-the-art的表现。