ICLROct, 2019

CLEVRER:用于视频表示和推理的碰撞事件

TL;DR介绍了一种新的视频数据集 CLEVRER,以组合描述、解释、预测和假设性问题的方式评估计算模型,结果表明现有的视觉推理模型在因果推理任务(解释性、预测性和假设性)方面表现不佳,需要在模型中融合语言输入和因果关系的理解。