ICLROct, 2019

CATER:组合动作和时间推理诊断数据集

TL;DR本文通过构建名称为 CATER 的视频数据集,从而提供了深入理解深度视频架构的诊断工具。在该数据集中,场景和对象的结构充满着隐含的偏见,这可以掩盖时间结构的变化,因此需要时空理解才能真正解决。