May, 2023

ANetQA:针对未修剪视频的细粒度组合推理的大规模基准测试

TL;DR本研究介绍了 ANetQA,这是一个支持对挑战性非剪辑视频进行精细组成式推理的大规模基准测试。与现有的基准测试相比,它通过自动从预注释场景图中生成 QA 对,使得可以对多样化的推理能力进行粒度控制。与AGQA相比,ANetQA的QA对具有更细粒度的语义特征,因此可以更好地帮助评估VideoQA模型。