BriefGPT.xyz
Jun, 2024
基于事件理解的视频数据集综述
A Survey of Video Datasets for Grounded Event Understanding
HTML
PDF
Kate Sanders, Benjamin Van Durme
TL;DR
通过调查105个需要事件理解能力的视频数据集,我们考虑它们对视频中鲁棒事件理解研究的贡献,并评估在这一研究领域中提出的视频事件提取任务,提出了基于调查结果的数据集策划和任务构建建议,特别强调视频事件的时间特性和视觉内容的歧义性。
Abstract
While existing
video benchmarks
largely consider specialized downstream tasks like retrieval or question-answering (QA), contemporary
multimodal ai systems
must be capable of well-rounded common-sense reasoning a
→