Nov, 2023

VITATECS:用于视频语言模型的时间概念理解诊断数据集

TL;DR通过引入细粒度的自然语言中的时间概念的分类,利用反事实视频描述来解开静态和时间信息之间的相关性,并评估典型的视频语言理解模型,揭示了对于视频语言研究中时间元素的更大重视的需求。