ICCVAug, 2023

开放式词汇视频问答:评估视频问答模型的通用性的新基准

TL;DR提出了 Open-vocabulary Video Question Answering(OVQA)基准测试,旨在通过考虑罕见和未知的答案来衡量 VideoQA 模型的泛化能力,并引入一种改进了模型泛化能力的新型 GNN-based soft verbalizer。