CVPRMay, 2022

从表示到推理:面向视频问答的证据与常识推理

TL;DR为了深化视频理解,包含描述、证据推理和常识推理等四类问题,我们提出了因果 - 视频问答任务及两步解决方案,发现最新 VideoQA 方法在描述方面表现强而在推理方面表现弱,希望 Causal-VidQA 能够引导视频理解研究从表示学习向深度推理发展。